
以英伟达的GB200芯片为例,单颗芯片功耗就达到1200瓦,天天电力消费约28.8千瓦时,接近美国一个通俗家庭的平均日用电量。因为弗成避免的焦耳热效应,这1200瓦几乎等量转化为热功率,理论上仅一小时就足以加热跨越50杯水。假如把成千上万,甚至数十万如许的芯片像如今如许密集堆叠在机架中,不进行任何冷却干涉,仅xAI的Colossus 1数据中间220,000块GPU、300兆瓦的功率,就足以在一小时内把大年夜约78.5万平方英尺的空间加热到约1200摄氏度,比岩浆还要炽热。由此可见,冷却已经成为数据中间运行中不容躲避、甚至是逝世活攸关的环节。
论文第一作者、机械工程师Behnood Bazmi指出,“冷倒是当前芯片设计的瓶颈。经由过程弥合计算设计与制造才能之间的鸿沟,我们的筹划为更高能效的芯片及各类电子设备液冷供给了一条新路径。”经久以来,数据中间重要依附风冷:在CPU、GPU上安装金属散热片,经由过程薄鳍片扩大热交换面积,再辅以大年夜功率风机强迫对流。为了驱动宏大年夜的空气处理体系,这一方法本身就消费大年夜量电力,并且面对新一代AI加快芯片激烈攀升的热流密度,传统风冷正愈发显得力不从心。
是以,行业正在加快转向直接贴片液冷筹划,即在处理器上方安装金属“冷板”,经由过程其内部渺小通道引导冷却液流动,将芯片热量快速导出。市情上的惯例冷板早已投入应用,但其内部鳍片与流道设计广泛以加工简便为优先,几何外形多为矩形或圆柱形,材料则多采取铝合金或不锈钢等,难以兼顾极致的换热机能与流动阻力控制。
伊利诺伊大年夜学团队的立异,集中表如今材料与鳍片构造这两个关键环节。研究人员采取拓扑优化办法,引入数学优化算法,对冷板内部微构造从新设计,从传统的方柱、圆柱形几何,演变到加倍复杂、锯齿状、尖利的三维形态,在兼顾流道阻力的前提下最大年夜化换热面积和热机能。因为这些高度复杂的构造几乎无法经由过程传统工艺经济地加工,团队转而采取先辈的电化学增材制造技巧(ECAM),以逐层聚积的方法直接生成所需外形。在材料选择上,他们大年夜胆应用导热机能极佳、但在惯例3D打印中极难精细成形的纯铜。
论文通信作者、机械工程师Nenad Miljkovic介绍,ECAM技巧可以将纯铜加工出细至30至50微米的精细特点,这一标准甚至小于一根人类头发的直径。实验成果显示,与商用惯例冷板比拟,这种经拓扑优化设计、由纯铜制成的冷板在液冷工况下最高可晋升约32%的冷却机能,同时将体系的压降降低最大年夜达68%。压降的降低意味着单位时光内推动冷却液轮回所需的泵功率大年夜幅削减,两者叠加带来明显的整体能耗节约。
研究团队进一步从数据中间整体层面进行了建模分析。在今朝风冷仍占主导的场景下,一座装机容量为1吉瓦的数据中间,仅冷却基本举措措施就可能须要约550兆瓦的额外功率。而在采取他们提出的优化液冷筹划后,雷同范围举措措施的冷却用电有望降至约11兆瓦。换言之,在保持对大年夜范围AI硬件产生的极端热量进行有效散热的同时,冷却的能耗占比有望从当前约30%至35%紧缩到约1.1%,整体降幅跨越95%。
假如这些模型猜测可以或许在真实的超大年夜范围安排中重现,其对数据中间能效的影响将是革命性的。按研究团队的估算,这一体系可助力数据中间实现约1.011的电源应用效力(PUE),意味着从电网输入的每一瓦功率几乎都直接用于计算,而不是被消费在冷却、输配电损耗或照明等帮助手段上。作为比较,今朝全球最先辈的一批超大年夜范围数据中间PUE大年夜多在1.1至1.3之间,而理论上“完美”的数据中间PUE为1.0,即没有任何能量浪费在冷却和支撑基本举措措施上。
根据国际能源署数据,2025年全球数据中间用电量达到485太瓦时,个中约30%—这一数值已经跨越瑞典一国全年的电力花费—被用于冷却举措措施本身。与此同时,生成式人工智能的快速成长,使得行业一度甚至开端推敲将数据中间建到太空,以获取更直接的太阳能供给。更具讽刺意味的是,在这些宏大年夜的电力开支中,约有三分之一与计算本身无关,只是用来把被芯片转化为热量的电能再“搬走”。
当然,研究团队也坦言,今朝关于整座数据中间能耗的数字仍然逗留在模型推演阶段,而非基于真实吉瓦级数据中间的现场实测成果。即便如斯,假如该技巧可以或许如预期那样在范围化安排中保持机能,其仍有望大年夜幅降低当前AI高潮背后被忽视的最大年夜隐机能耗之一——数据中间冷却。研究人员认为,这一将设计优化与先辈制造工艺相结合的思路,并不仅限于数据中间,还可拓展用于更广泛的电子设备甚至其他须要高效热治理的工程范畴。

发表评论 取消回复