液冷散热——AI算力时代的数据中心散热革命

新闻
5小时前

一、行业背景


液冷散热(Liquid Cooling)是指利用液体作为热量传输介质,通过液体流动带走电子设备(主要为服务器、GPU芯片)热量的散热技术。与传统风冷相比,液体比热容约为空气的3,000倍以上,能够更高效、更精准地控制温度,已成为AI算力时代数据中心散热的主流选择。

行业驱动的核心背景:


  • AI大模型军备竞赛:ChatGPT以来,全球大模型训练进入白热化竞争,GPU算力需求爆发式增长,单芯片TDP从A100的400W跃升至H200的700W,NVIDIA GB200 NVL72满载功耗可达135~140kW/机架,传统风冷已无法满足散热需求。

  • PUE监管趋严:全国数据中心PUE红线持续收紧,新建大型数据中心要求PUE低于1.3,液冷技术可将PUE降至1.1以下,成为满足政策要求的必选技术。

  • 单机柜功率密度飙升:AI训练集群单机柜功率密度从传统20~30kW跃升至60~120kW以上,超算中心甚至达到200~500kW,风冷接近物理极限,液冷成为必然选择。

  • "东数西算"工程:国家算力枢纽布局推进,液冷作为绿色低碳散热方案,在西部低PUE要求区域更受青睐。

二、技术路线深度对比分析


当前主流液冷技术分为三大路线:冷板式(间接接触)、浸没式(直接接触)、喷淋式。不同技术路线在散热效率、成熟度、成本和适用场景上各有差异。


2.1 冷板式液冷(Cold Plate Liquid Cooling)

  • 技术原理:通过金属冷板(通常为铜/铝材质,带微通道设计)与芯片/元器件直接接触,冷板内循环冷却液(多为去离子水或乙二醇水溶液),将热量从芯片表面带走,再通过 CDU(冷却液分配单元)将热量传递至室外换热器(干冷器/冷却塔)进行散热。

  • 技术特点:属于间接接触型液冷,冷却液不直接接触芯片,通过冷板界面进行热交换。微通道强化换热技术使冷板式液冷具有极高的散热性能,目前行业成熟度最高。

  • 适用场景:AI服务器(GPU/ CPU直接散热)、通用服务器高密度部署、交换机/路由器等网络设备。

  • 核心优势:相比浸没式改造成本低,与现有服务器架构兼容性高;热交换效率高,可支持单芯片500W以上散热需求;维护相对简便,可实现热插拔维护。

  • 核心劣势:单相冷板散热能力受冷板面积限制,极端高功率芯片需要更大的冷板;冷却液渗漏风险需要可靠的密封设计;冷却液侧温差受冷板限制。

  • 市场地位:目前市场渗透率最高,预计2025年80%的AI服务器出货量将采用液冷方案,其中冷板式占比约60~70%,是当前最主流的液冷技术路线。

2.2 浸没式液冷(Immersion Cooling)

  • 技术原理:将整个服务器(或芯片模组)完全浸没在绝缘冷却液中,冷却液直接接触所有发热元件,通过液体对流将热量带走,再通过外部热交换器进行散热。根据冷却液沸点,分为单相浸没(冷却液不发生相变)和两相浸没(冷却液在芯片表面沸腾后冷凝回收)。

  • 技术特点:实现了100%液体冷却,散热效率最优,但初期改造成本最高,技术复杂度最大。

  • 适用场景:超高功率密度场景(≥100kW/机架)、边缘计算节点、GPU集群定制化部署。

  • 核心优势:散热效率最高,PUE可降至1.05以下;冷却液比热容利用充分,温度均匀性好;适合未来超高高功率芯片(500W~1000W+)部署;数据中心整体占地面积可节约20%~40%。

  • 核心劣势:初期投资成本高(基础设施改造幅度大);维护复杂度高,需要专业运维;冷却液成本高(浸没专用氟化液单价约200~400元/升);氟化液环保性和报废处理存在争议。

  • 市场地位:2025年NVIDIA GB200 NVL72的发布将推动浸没式液冷加速渗透,头部CSP(云服务商)如微软、谷歌已在自建数据中心大规模采用浸没式方案。国内浪潮信息与英特尔联合发布全球首个全浸没式液冷服务器参考设计,推动产业生态加速成熟。

2.3 喷淋式液冷(Spray Cooling)

  • 技术原理:通过喷嘴将冷却液喷洒到服务器元器件表面,利用液体的蒸发和流动带走热量,属于直接接触型液冷的一种。相比浸没式,冷却液用量更少,但系统设计复杂度较高。

  • 适用场景:特定高热流密度场景(GPU模组、FPGA等)、高功率定制化服务器。

  • 核心优势:冷却液用量比浸没式少70%~80%;冷却效率高,温度控制精准;喷淋范围可通过喷嘴布局精确控制。

  • 核心劣势:喷嘴堵塞风险,维护难度大;系统可靠性受喷嘴分布均匀性影响;商业化成熟度相对最低,目前行业生态较小。

  • 市场地位:技术研发阶段,商业化案例较少,适合特定定制化场景,规模化应用仍需时间验证。

2.4 技术路线综合对比

维度

冷板式液冷

单相浸没式

两相浸没式

喷淋式液冷

混合风冷

传统风冷

成熟度

★★★★★

★★★

★★★

★★

★★★★

★★★★★

散热能力

极高

极高

改造成本

极高

PUE水平

1.1~1.2

1.05~1.1

1.02~1.05

1.08~1.15

1.2~1.4

1.4~1.8


三、全球及中国市场规模

3.1 全球市场规模

  • 2025年全球数据中心液冷市场规模预计为187.8亿美元,预计2034年将达541.8亿美元,预测期内CAGR高达12.60%(Fortune Business Insights)。


3.2 中国市场规模


  • 据智研咨询,2024年我国智算中心液冷市场规模已达到184亿元,从2023年同比增长66.1%;预计2025年我国智算中心液冷市场规模有望达到365亿元,预计2029年将超过600亿元。

  • IDC预测,2024-2029年中国液冷服务器市场年复合增长率(CAGR)将达46.8%,2029年市场规模将达到162亿美元(约合1,100亿元人民币)。

3.3 市场驱动因素量化拆解

  • AI服务器出货爆发:2025年全球AI服务器出货量预计达120万台,其中80%采用液冷方案,单台液冷服务器价值量约15~30万元,市场空间巨大。

  • 单机柜功率密度提升:超算中心单机柜功率密度从20kW提升至40kW+,对应液冷系统价值量翻2~3倍。

  • 渗透率加速:2023年液冷在新建大型数据中心渗透率约25%,2024年快速提升至约40%,预计2027年将超过70%。

四、产业链深度分析

4.1 上游:核心零部件与材料(液冷全产业链的基础支撑)

  • 冷却液(Coolant):液冷系统的"血液",分为去离子水/乙二醇溶液(用于冷板式,约占60%市场)和氟化液(用于浸没式,约占15%市场)。氟化液技术壁垒高,目前由3M、苏威等海外厂商主导,国产替代正在加速(国产氟化液价格约为进口产品的60%~70%)。

  • CDU(Coolant Distribution Unit,冷却液分配单元):液冷系统"心脏",负责将冷却液分配至各服务器机柜,同时实现热量传递至室外换热器。CDU是液冷系统价值量最高的零部件之一,单价5~30万元/台,技术壁垒高,需要可靠的无间断运行能力。英维克是A股唯一实现CDU、液冷板、快接头全产业链布局的企业。

  • 快换接头(Quick Coupler):液冷管路连接的核心部件,关乎系统安全与可靠性,其技术专利和认证构成了主要护城河。强瑞技术作为液冷快接头核心供应商,已进入华为、英伟达两大巨头供应链。

  • 泵阀(Pump & Valve):冷却液循环的动力装置,需要24×7不间断运行,可靠性要求极高。代表企业有川仪股份、南方泵业等。

  • 换热器(Heat Exchanger):室内CDU与室外干冷器之间的热交换核心器件,需要高换热效率、低压降设计。

  • 管路及连接件:不锈钢/UPVC管路、快插接头、密封件等,标准化程度逐步提升。

4.2 中游:液冷IT设备与系统集成

  • 液冷服务器:华为、浪潮信息、新华三、联想等服务器厂商推出的搭载液冷散热方案的AI服务器,分为冷板式和浸没式两大类。华为液冷服务器已通过Tier 1认证,是国内大陆唯一获得该认证的液冷供应商。

  • 液冷系统集成:将CDU、液冷管路、室外换热器、控制软件等整合为完整的液冷系统解决方案,主要玩家包括维谛技术(Vertiv)、华为、艾默生/维谛、施耐德电气等国际巨头,以及英维克、维谛技术等国内龙头。

  • 核心壁垒:CDU的设计与制造(需要高可靠泵阀、精密控制算法)、管路系统的泄漏防护(N+1冗余、泄漏检测)、与服务器厂商的联合设计认证。

4.3 下游:应用领域

  • AI算力中心/智算中心(最大市场):GPU集群(NVIDIA H100/H200/GB200集群)单机柜功率密度60~140kW,是液冷最大单一应用场景。

  • 通用数据中心:互联网云厂商(阿里云、腾讯云、华为云等)新建数据中心,PUE限制推动液冷加速渗透。

  • 超算中心:国家超级计算中心(无锡、上海、深圳等),单机柜功率密度200~500kW,只能依靠液冷+浸没式方案。

  • 储能温控:储能电站集装箱温控需求,液冷方案渗透率从2023年的15%快速提升至2025年的约35%,预计2025年全球储能液冷市场规模约30亿美元。

  • 车载散热:新能源汽车大功率电控系统、动力电池热管理,部分采用液冷方案,但市场规模远小于数据中心。

  • 边缘计算:边缘数据中心空间有限、散热条件差,液冷可有效解决高密度部署难题。

五、竞争格局深度分析

5.1 全球竞争格局


全球液冷市场呈现"国际巨头+国内龙头"的二元竞争格局:


企业

国家/地区

核心优势

全球地位

维谛技术(Vertiv

美国

数据中心液冷全球龙头,提供全套液冷解决方案(CDU+冷板+干冷器),Vertiv Geist品牌液冷管路全球领先

全球数据中心液冷份额第一,AI服务器液冷核心供应商

施耐德电气(Schneider

法国

APC品牌在数据中心基础设施领域积累深厚,液冷方案整合至EcoStruxure平台

数据中心基础设施整体方案领导者

3M

美国

Novec 7000/7100氟化液全球垄断者,浸没式液冷冷却液核心技术掌控

浸没式液冷冷却液全球垄断,氟化液价格决定浸没式方案成本下限

Liquid Stack

美国

专注于浸没式液冷解决方案,与头部CSP合作紧密

浸没式液冷技术先驱,浸没式方案市场领导者

华为

中国

全栈液冷服务器+CDU+温控,GB200液冷方案通过英伟达认证

中国液冷服务器龙头,全球AI液冷重要参与者,已获全球Tier1认证

5.2 国内竞争格局与核心厂商

  • 英维克(002837.SZ):A股唯一实现"CDU+液冷板+快接头至整机柜液冷"全产业链布局的企业,技术积淀深厚。2025年推出"一次侧/二次侧分离式液冷架构",将CDU泄漏风险降低90%,支持7×24小时无间断运行。Coolinside全链条破除"液冷焦虑",市场份额快速提升,总市值突破千亿元。

  • 华为技术有限公司:液冷服务器通过英伟达严苛的NPN Tier1认证,是中国大陆唯一获得该认证的液冷供应商。已成功抢单英伟达GB200液冷订单,比工业富联还正宗,打破了维谛技术一家独大的格局。

  • 浪潮信息(000977.SZ):与英特尔联合发布全球首个全浸没式液冷服务器参考设计,液冷AI服务器产品线完整,在通用AI服务器液冷市场份额位居国内前三。

  • 强瑞技术(301163.SZ):液冷快接头核心供应商,已进入华为、英伟达两大巨头供应链,快接头技术专利和认证构成核心护城河。

  • 维谛技术中国(Vertiv China):国际龙头优势延续,在中国数据中心液冷市场占据重要份额。

  • 施耐德电气中国(Schneider China):APC+数字化平台战略,液冷解决方案整合度持续提升。

  • 曙光数创(872808.BJ):中科曙光旗下液冷业务主体,在高性能计算液冷领域积累深厚。

  • 高澜股份(300499.SZ):数据中心温控设备供应商,液冷产品已实现小批量出货。

5.3 竞争格局特征与演变趋势

  • 国产化率快速提升:从2023年的约10%提升至2024年的约40%,国内厂商在冷板式液冷领域已具备与国际巨头正面竞争能力。

  • 竞争焦点从技术转向系统集成能力:从单纯的技术先进性,转向"液冷系统整体解决方案+交付能力+运维服务"的全维度竞争。

  • 上游核心零部件成关键瓶颈:CDU、快换接头的供应能力成为决定厂商市场份额的核心因素,供应链垂直整合能力愈发重要。

  • 英伟达认证体系成为竞争分水岭:GB200液冷方案需通过NPN Tier1认证,华为率先突围,浪潮信息、新华三等正在追赶。

六、核心技术壁垒深度解析

6.1 CDU设计与制造

  • CDU是液冷系统价值量最高、最核心的零部件,负责将冷却液分配至机柜并实现热量传递。其设计需要综合流体力学、热力学、材料学知识,需要解决高可靠泵选型、精密流量分配、泄漏检测等难题。

  • 平均毛利率:约40%~55%,是液冷产业链中利润最丰厚的环节。

  • 技术护城河:N+1冗余设计(支持7×24h无间断运行)、智能流量分配算法、泄漏快速响应机制,需要长期项目经验积累。

6.2微通道冷板设计与精密制造

  • 冷板内部微通道设计决定散热能力上限,需要CFD仿真优化流道布局,通道直径从毫米级降至亚毫米级以强化换热。

  • 材料选择:铜合金(导热系数≥380 W/m·K)或铝合金(导热系数≥200 W/m·K),需兼顾重量和成本。

  • 密封技术:冷板与管路的连接密封性直接决定系统可靠性,需要专业密封设计和检测工艺。

6.3快换接头技术

  • 快换接头是液冷管路的"连接器",需要实现液冷系统热插拔维护,同时在极端振动、高温高压环境下不泄漏。

  • 技术专利和认证构建护城河:进入华为、英伟达等顶级客户供应链需通过严苛的产品认证(ISO 9001、TL 9000等)和客户专项认证。

6.4系统级热管理与PUE优化

  • 液冷系统设计需要从芯片级热管理→服务器级→机柜级→数据中心级的全层级热管理协同,涉及CFD仿真、系统建模、AI优化算法等综合能力。

  • PUE优化路径:液冷系统+自然冷却(利用冬季低温)+AI热负荷预测,可将数据中心PUE降至1.08以下,实现极致能效。

七、应用场景深度分析

7.1 AI服务器(最核心场景)

  • GPU芯片散热需求:从A100的400W/HBM封装→H200的700W→GB200的1,000W+,功率密度持续飙升,传统风冷根本无法满足。

  • 整机柜功率密度:GB200 NVL72整机柜功率可达130~140kW,只能通过冷板式液冷或两相浸没式液冷解决。

  • 英伟达推动:NVIDIA在GTC 2026大会上明确表示,下一代Vera Rubin等AI平台将全面采用液冷,配套Manifold(歧管)、UQD/MQD(快拆接头)、Cold Plate等液冷组件。

  • 市场预测:2025年全球AI服务器出货量120万台,80%采用液冷方案,液冷AI服务器市场规模约1,200亿元人民币。

7.2智算中心与超算中心

  • 智算中心:地方政府主导的新型基础设施投资项目,功率密度设计普遍≥40kW/机柜,液冷为标准配置。2024年智算中心液冷市场规模184亿元,同比+66.1%。

  • 国家超算中心:无锡、上海、深圳、合肥等国家级超算中心,单机柜功率密度200~500kW,只能采用液冷方案,其中浸没式占比约60%。

  • 运营商智算投资:三大运营商(中国移动/联通/电信)2024年智算投资合计超2,000亿元,液冷作为算力基础设施核心组件直接受益。

7.3通用数据中心与云计算

  • 互联网巨头:阿里云、腾讯云、华为云、百度云等新建数据中心,液冷渗透率从2022年的约10%提升至2025年的约35%。

  • 金融数据中心:银行、保险、证券等金融机构数据中心,安全可靠性要求极高,液冷渗透率相对较低(约15%),但正在加速。

  • PUE限制:一线城市(北京、上海、深圳等)新建数据中心PUE要求≤1.3,液冷是实现该目标的核心技术路径。

7.4储能温控(快速成长的增量市场)

  • 储能电池热失控风险:锂电池在大功率充放电过程中温升显著,温控不当可能引发热失控,液冷温控方案可有效控制电池温度在25~35℃的最佳工作区间。

  • 渗透率快速提升:从2022年的约10%→2024年的约30%→2025年的约35%,大功率储能系统(280Ah以上电芯)几乎标配液冷温控。

  • 市场空间:2025年全球储能液冷市场规模约30亿美元(约210亿元人民币),预计2030年将超过80亿美元。

八、主要厂商深度分析

8.1英维克(002837.SZ)——A股液冷全产业链龙头

  • 核心优势:A股唯一实现CDU、液冷板、快接头至整机柜液冷全产业链布局的企业,技术积淀超过15年。Coolinside全链条解决方案破除"液冷焦虑",在一次侧/二次侧分离式液冷架构上实现技术突破,CDU泄漏风险降低90%,支持7×24小时无间断运行。

  • 市场地位:国内液冷服务器温控市场份额第一,客户覆盖华为、浪潮、头部CSP等。2024年以来液冷业务收入加速增长,2025年市值突破千亿。

  • 战略布局:从精密温控切入液冷全链条,整合上游CDU和快接头产能,构建垂直一体化护城河。

8.2华为技术有限公司——液冷服务器全球破局者

  • 核心优势:通过英伟达NPN Tier1认证,是中国大陆唯一获得该认证的液冷供应商。在GB200液冷方案中获得英伟达认可,成功抢单,打破了维谛技术一家独大的格局。

  • 产品线:覆盖液冷服务器(Mate server系列)、CDU、室外干冷器全产品线,可提供端到端液冷解决方案。

  • 技术突破:自研液冷管路、快换接头、热管理算法,与英伟达联合设计GB200 NVL72液冷方案,技术协同深度领先行业。

8.3强瑞技术(301163.SZ)——液冷快接头隐形冠军

  • 核心优势:液冷快接头核心供应商,已进入华为、英伟达两大巨头供应链。快换接头技术专利和客户认证构建了核心护城河。

  • 客户结构:前五大客户销售占比集中,华为是第一大客户,同时是英伟达指定快接头供应商。

  • 成长逻辑:液冷快接头在AI服务器中的价值量约5,000~20,000元/台,随AI服务器出货量爆发,快接头需求将呈指数级增长。

8.4维谛技术(Vertiv)——全球数据中心液冷龙头

  • 核心优势:全球数据中心液冷市场份额第一,Vertiv Geist品牌液冷管路、Liebert XDC CDU、室外干冷器构成完整产品矩阵。在大型数据中心液冷市场的品牌认知度和客户粘性极强。

  • 技术特色:提供混合风冷+液冷(混合散热)以及全液冷数据中心两种方案,可根据客户需求灵活配置。

  • 全球布局:在北美、欧洲、亚太均设有液冷系统研发和制造中心,可为全球客户提供本地化交付。

8.5浪潮信息(000977.SZ)——浸没式液冷先驱

  • 核心优势:与英特尔联合发布全球首个全浸没式液冷服务器参考设计,推动浸没式液冷技术标准化和生态化。在AI服务器液冷领域技术储备深厚,冷板式+浸没式双路线并行。

  • 战略布局:浸没式液冷定位于未来超高功率密度场景(GB200 NVL72及以上),冷板式覆盖当前主流AI服务器市场。

九、发展趋势与关注建议

9.1行业发展六大趋势

  • AI驱动功率密度持续突破上限:GPU芯片TDP从400W→700W→1,000W+的演进路径清晰,单机柜功率密度将从40kW→100kW→200kW逐级跃升,液冷技术需要持续升级以匹配。

  • 浸没式液冷从"备选"变"必选":随着NVIDIA GB200及后续架构全面要求液冷,浸没式液冷将从高端定制场景进入大规模商业部署阶段,预计2027年浸没式液冷在全球AI数据中心渗透率将超过25%。

  • 液冷系统从"硬件"到"软硬一体":AI热负荷预测、自适应流量调节、数字孪生热管理将成为液冷系统的标准功能,智能化液冷控制将PUE优化能力提升30%以上。

  • 氟化液国产化加速:浸没式液冷成本高企的瓶颈在于氟化液进口价格(200~400元/升),国产氟化液替代正在加速,国产氟化液价格仅为进口的60%~70%,浸没式方案成本下降空间约30%~40%。

  • CDN/CDU等核心零部件国产化率提升:强瑞技术等上游厂商在快换接头领域已实现技术突破,预计2026年国内CDU国产化率将超过60%。

  • 液冷与储能温控协同:液冷技术从数据中心延伸至储能领域,储能液冷系统与数据中心液冷在CDU、管路技术上存在大量协同,头部厂商开始布局双赛道。

9.2关注建议

  • 重点关注液冷全产业链布局的龙头:英维克(CDU+液冷板+快接头全链条)、华为(液冷服务器+CDU+Tier1认证)等具备技术壁垒和规模优势的企业。

  • 关注上游核心零部件的国产替代机会:快换接头(强瑞技术)、氟化液国产化(国内氟化工龙头)赛道,技术壁垒高,业绩弹性大。

  • 关注"液冷+AI服务器"交叉布局的厂商:浪潮信息、新华三等在液冷AI服务器领域布局深厚,受益于AI算力爆发带来的需求共振。

  • 关注储能液冷的增量机会:储能液冷市场2025-2030年CAGR预计超过20%,是液冷厂商的第二增长曲线。

  • 谨慎对待:上游冷却液(氟化液)进口依赖风险、液冷系统交付周期长导致的现金流压力、中美科技摩擦对英伟达供应链的影响。

来自验证硬科技