Page 40 - 网络电信2024年10月刊
P. 40

解决方案

智算中心冷板式液冷解耦化技术研究

吴宏杰1,樊朝阳2,王运泽1,刘丹1,李自勇1,侯佳琪1
1.中国移动通信集团设计院有限公司 2.中国电子技术标准化研究院

                        摘要:随着人工智能、大数据、元宇宙等新一代信息技术对算力需求的爆发式增长,智算中心的
                  算力缺口持续加大,高密集约、绿色低碳成为算力基础设施研究的重点方向,液冷技术已成为解决智算
                  中心高密散热难题的首要选择。为研究冷板式液冷技术在智算中心应用的最佳交付模式,重点分析冷板
                  液冷服务器与液冷机柜解耦化交付模式中需要关注的关键技术。针对解耦冷板式液冷系统中流体连接
                  器、冷却液和供电形式的选择进行深入研究,提供液冷服务器与机柜接口标准化解决方案,为后续发展
                  冷板式液冷解耦化提供技术依据。

                        关键词:数据中心;液冷技术;解耦交付

    1 智算中心发展背景                    2025年)》指出到2025年,新建大型、超大型数据中心PUE优于
                                  1.3[2];国家发展改革委、国家数据局、中央网信办、工信部、
      随着AI大模型的快速发展,各种深度学习算法和机器学习  国家能源局印发的《关于深入实施“东数西算”工程加快构建
模型在复杂性和规模上都有了显著增长。为了支撑这些先进模       全国一体化算力网的实施意见》提出推进数据中心用能设备节
型的训练与推理,需要强大的计算能力,由此引发了智算中心       能降碳改造,推广液冷等先进散热技术[3]。在国家政策的大力
(人工智能计算中心)的技术升级和方案变革。智算中心基础设      驱动下,液冷已成为实现数据中心绿色低碳发展的重要技术手段。
施不同于传统机房,需以算力为中心,在算力需求不断增长和
绿色节能的政策要求共同驱动下,液冷技术已成为解决智算中           2 冷板式液冷技术应用现状
心高密散热难题的首要选择[1]。
                                        液冷技术对比传统风冷散热技术具有诸多优势[4]。由于液
      智算中心是指专门配置了用于执行人工智能算法的高性能   体比空气具有更高的热容和热导率,可以更有效地吸收和传输
计算资源的数据中心。它们专为训练复杂的机器学习模型、支       热量,这意味着液冷系统可以更快速地从热源(如处理器)中抽
持深度学习任务以及处理大量AI工作负载而设计。智算中心通      取热量,并有效地将其传输到热交换器或冷却塔中,从而使设
常搭载了大量高性能的CPU、GPU或TPUs等处理器以提供必要的  备运行在较低的温度下,减少局部热点的产生,提高设备的稳
计算能力,采用并行计算架构来提高处理速度和效率,配有高       定性和寿命。由于液冷系统的高效率,对冷却液泵的功率要求
速且容量巨大的存储系统用于处理和存储大量的训练数据集。       远低于空调或风扇系统所需的功率,减少了电力消耗,降低了
为了满足AI训练常用的数据并行、模型并行、流水线并行等混      运行成本。液冷技术使得服务器可以进行更紧凑地组件布局,
合并行策略的通信需求,需要为芯片间和节点间提供低延迟、       减少所需的基础设施和空间,满足数据中心高密化演进需求。
高带宽的互联,因此AI训练集群化带来了数据中心高密化需       传统空调冷却系统依赖于大量使用能量密集的压缩机和潜在环
求,从而衍生出了散热问题的技术革命。高性能计算(HPC)和AI   境危害的制冷剂(氢氟碳化物),液冷技术减少了对这些制冷剂
应用产生的热量巨大,这对智算中心机房的冷却系统提出了极       的依赖,有助于减少温室气体排放。
高要求,同时减少能源消耗和提高能源效率也是降低运营成本
和实现绿色低碳的关键。                             液冷技术主要分为冷板式液冷和浸没式液冷两个方向,其
                                  中冷板式液冷是目前国内应用最成熟和交付规模体量最大的液
      国家对PUE日益严格的要求也在激发数据中心采用更高效  冷方式。冷板式液冷可以兼容多种服务器架构,容易与现有的
的制冷技术。国家发展改革委、国务院国资委、工信部等七        空气冷却数据中心设计整合,使得过渡到使用液冷技术的门槛
部联合印发的《信息通信行业绿色低碳发展行动计划(2022—     较低。与浸没式液冷相比,冷板式液冷的设计和工程实施相对

58 网络电信 二零二四年十月
   35   36   37   38   39   40   41   42   43   44   45