文章

液冷服务器,算力减碳的“排头兵”

2023-12-29e-works 吴婕

5814阅
在“双碳”政策的持续推进下,绿色低碳的液冷服务器备受青睐,成为算力减碳的“排头兵”。什么是液冷服务器?液冷服务器的关键技术是什么?有哪些突出的特点和表现优异的厂商?中国液冷服务器的市场状况如何?本文将对液冷服务器进行系统解读。
       物联网、云计算、人工智能、边缘计算等新兴技术热潮汹涌,算力时代疾驰而至。服务器作为算力的基石,正朝着高性能、多元计算、灵活多变、稳定可靠、绿色低碳的方向发展,推动着服务器细分赛道的繁荣。尤其是在“双碳”政策的持续推进下,绿色低碳的液冷服务器备受青睐,成为算力减碳的“排头兵”。

       那么,什么是液冷服务器?液冷服务器的关键技术是什么?有哪些突出的特点和表现优异的厂商?中国液冷服务器的市场状况如何?本文将对液冷服务器进行系统解读。

一、认识液冷服务器

       近年来算力需求狂飙,芯片热功率已达到风冷极限,国家对“能耗大户”数据中心PUE[ PUE=数据中心总能耗/IT设备能耗,其中数据中心总能耗包括IT设备能耗和制冷、配电等系统的能耗,其值大于1,越接近1表明非IT设备耗能越少,即能效水平越好。]提出了更高的要求,叠加“双碳”政策的持续推进,服务器作为核心IT基础设施,如何承受散热和“碳能双考”等多重压力?

       液冷技术在服务器中的应用成为首选方法之一。液冷服务器,顾名思义,即将液体作为冷媒注入服务器,通过液体流动带走服务器运行时产生的热量,以此达到冷却的目的。与传统风冷服务器相比,液冷服务器具有散热效率更高、耗电量更低、噪音污染更小等优势,如下表所示。值得注意的是,相比液冷服务器,风冷服务器由于发展时间久,技术相对成熟,目前仍然是大多数数据中心和企业选择的主流,但是随着能源效率需求的增加,液冷服务器将是代替风冷的必然选择。
表1 风冷服务器与液冷服务器比较
表1 风冷服务器与液冷服务器比较

       回顾液冷服务器的发展历程,主要经历了三个阶段,如下图所示。其中国外厂商涉足较早,在1964年,IBM就研发出了世界首款冷冻水冷却计算机System 360,2008年又发布了液冷超级计算机Power 575,成为液冷服务器的先发企业。纵观国内,2011年,中科曙光率先开始了服务器液冷技术的探索与研究,随后华为、浪潮、联想等科技企业急起直追,纷纷入局液冷服务器。
图1 液冷服务器发展历程
图1 液冷服务器发展历程

       当然,液冷服务器的落地应用不仅仅只是液冷服务器厂商的单打独斗,还包括上游的接头、CDU、电磁阀、冷却液、集成管路(manifold)、浸没液冷TANK等技术、产品提供商;中游的液冷服务器、芯片、液冷集成设施、模块与机柜等液冷基础设施提供商;下游的电信运营商、互联网企业、政府、科研机构、金融、能源以及交通等其他信息化算力使用者,如下图所示。
图2 液冷服务器产业链厂商图谱
图2 液冷服务器产业链厂商图谱

二、液冷服务器的技术解析

       传统风冷服务器使用空气作为冷媒,液冷服务器则使用去离子水、醇基溶液、氟碳类工质、矿物油或硅油等液体作为冷媒。而根据冷却液与发热源的接触方式,液冷服务器可分为非接触式液冷和接触式液冷两大类,如下图所示。
图3 液冷技术及液冷服务器分类
图3 液冷技术及液冷服务器分类

1、冷板式液冷

       冷板式液冷为非接触式液冷,其工作原理是将服务器发热元件(如CPU、GPU、内存等高发热部件)贴近液冷板(通常为铜铝等导热金属构成的封闭腔体),冷却液在液冷板内流动,带走发热元件的热量,冷却液不与发热源直接接触,冷却液多采用去离子水、乙二醇溶液、丙二醇溶液等。冷板式液冷系统主要由冷却塔、CDU、一次侧&二次侧液冷管路、冷却液、液冷机柜组成;其中液冷机柜内包含液冷板、设备内液冷管路、流体连接器、分液器等,冷板式液冷原理如下图所示。
图4 冷板式液冷系统原理图(图片来源:中兴通讯液冷技术白皮书)
图4 冷板式液冷系统原理图(图片来源:中兴通讯液冷技术白皮书)

       冷板式液冷服务器在行业内具有10年以上的研究积累,技术相对成熟,相比传统风冷散热技术可实现60%~90%的能耗降低,并且兼容现有硬件架构,对当前机房配套和服务器改造难度和成本较小。但冷板式液冷只是对高发热器件实现液体冷却,对于低发热元件(如主板、电源等)仍需要增设风冷单元进行散热,未能实现100%的液冷散热。
图5 冷板式液冷服务器(来源:中科曙光官网)
图5 冷板式液冷服务器(来源:中科曙光官网)

       提供此技术的典型厂商主要有IBM、谷歌、华为、浪潮信息、联想、中科曙光、中兴通讯等。例如,IBM在其Power 575的处理器上应用铜水冷板方案;谷歌的水冷服务器就是由散热片内流过温度较低的冷冻水带走元器件热量;华为的FusionServer Pro全液冷系统解决方案面向IT设备高密部署,其智能服务器使用冷板式液冷;浪潮信息已实现通用服务器、高密度服务器、整机柜服务器、AI服务器四大系列全线产品均支持冷板式液冷;联想的温水水冷技术利用纯水或去离子水作为冷媒,通过间接冷板式液冷方式对服务器进行冷却;中科曙光通过对风冷刀片服务器进行冷板式液冷改造设计推出了TC4600E-LP 液冷刀片服务器;中兴通讯的G5系列服务器新品采用冷板式液冷散热,可实现数据中心PUE降至1.1;等等。

2、浸没式液冷

       浸没式液冷属于直接液冷,其工作原理是将整个服务器或其组件直接浸没在冷却液中,液体与发热源直接接触,通过液体升温或相变带走服务器中所有发热元件的热量,冷却液多采用矿物油、硅油、氟化液等不导电、非腐蚀性液体。其中浸没式液冷根据冷却液在浸没腔体中形态的不同,可以进一步分为单相浸没式液冷和双相浸没式液冷两种。

       单相浸没式液冷

       在单相浸没式液冷中,冷却液在热量传递过程中仅发生温度变化,不存在相态转变仍保持液体状态。单相浸没液冷系统原理是将服务器直接浸没在冷却液中,冷却液吸收服务器产生的热量后由浸没腔体顶部出口流回CDU,通过CDU内部的板式换热器将吸收的热量传递给一次侧冷却液,再通过外部冷却装置(如冷却塔)将热量排放到大气环境中,如下图所示。
图6 单相浸没式液冷系统原理图(图片来源:中兴通讯液冷技术白皮书)
图6 单相浸没式液冷系统原理图(图片来源:中兴通讯液冷技术白皮书)

       两相浸没式液冷

       两相浸没式液冷的传热路径与单相浸没液冷基本一致,不同之处在于冷却液在密闭腔体中与发热器件进行热交换时发生相态转变,沸腾形成冷却液气体汇聚到浸没腔体顶部,与安装在顶部的冷凝器发生换热后冷凝为低温液态冷却液下沉到腔体底部,循环继续,如下图所示。
图7 两相浸没式液冷系统原理(图片来源:中兴通讯液冷技术白皮书)
图7 两相浸没式液冷系统原理(图片来源:中兴通讯液冷技术白皮书)

       与传统风冷和冷板式液冷相比,浸没式液冷服务器可完全去除散热风扇,实现100%液体冷却,能大幅降低冷却能耗,节能效果好,数据中心PUE值可降至1.13及以下,但是浸没式液冷服务器改造成本比冷板式液冷服务器高。首先,从现场改造的角度来看,浸没式液冷需要为IT设备配备水槽或新的机箱,机柜内需要充满冷却液导致重量增加,对机房有较高的承重要求;其次,浸没式液冷服务器需要将服务器组件完全浸入液体中,为保证冷却液体能够有效地接触到散热部件,并防止液体渗入电路板等敏感部分造成损坏,这就需要与服务器供应商或专业的液冷系统集成商合作,进行定制化的开发和部署;此外,后期维护时,需要配备专用维护辅助设备(可移动机械吊臂或专业维护车)实现设备的竖直插拔。
图8 浸没式液冷服务器(图片来源:宁畅浸没式液冷服务器B7000)
图8 浸没式液冷服务器(图片来源:宁畅浸没式液冷服务器B7000)

       目前,戴尔、中科曙光、新华三、宁畅、阿里云等国内外厂商都推出了各自的浸没式液冷服务器产品。例如,戴尔全新一代Dell PowerEdge服务器可以支持冷板式和浸没式液冷,能够满足不同用户的需求;中科曙光实现全球首个“刀片式相变浸没液冷技术”大规模部署,其浸没式液冷 C8000 系列是针对超高密度刀片服务器散热问题所推出浸没液冷基础设施产品;新华三集团联合浙江诺亚氟化工共同发布了机架箱式浸没服务器H3C UniServer Cube,实现了冷板式、浸没式两种路线的优势融合;宁畅发布了浸没式液冷服务器B7000,在PUE值方面可实现低于1.05;阿里云的单相浸没液冷解决方案——磐久液冷一体机Immersion DC 1000系列,让服务器集体“泡”水;等等。

3、喷淋式液冷

       与浸没式液冷相比,喷淋式液冷通常不需要对现有的基础设施进行大幅度地改动,只需在喷淋模块调整喷淋头,使冷却液从服务器机箱顶部喷淋下来,精准喷洒于发热元件进行对流换热,被加热后的冷却液将通过回液箱进行收集,并通过泵输送至CDU冷量分配单元进行下一个制冷循环,冷却液多采用矿物油、氟化液等不导电、非腐蚀性液体,如下图所示。
图9 喷淋式液冷系统原理图(图片来源:中兴通讯液冷技术白皮书)
图9 喷淋式液冷系统原理图(图片来源:中兴通讯液冷技术白皮书)

       喷淋式液冷服务器同样实现了100%液冷,相较于浸没式液冷节省冷却液,数据中心PUE可降至1.1左右。但目前技术还处于发展初期,喷淋冷却的传热机理复杂,未有统一的传热模型,且服务器整体密封于机柜中,排液、补液,维护时会破坏服务器原有密封结构,运维难度最高,有待深入研究。

       当前国内主要有中国长城和广东合一专注喷淋式液冷解决方案。其中,中国长城推出了我国首台国产化喷淋式液冷服务器,是一款具有完全自主知识产权、致力于攻克服务器件精准散热难题的服务器;广东合一自主研发了“芯片级精准喷淋液冷技术”,根据电子器件发热位置和发热量大小,在服务器喷淋板对应位置开孔,让冷却液对发热体进行喷淋,达到设备精准冷却的目的。

三、液冷服务器的市场动态

       目前国内液冷服务器行业仍处于初级发展阶段,其技术路线、产品结构、行业标准等还在不断演进,尚未形成统一的规范,但由于绿色算力需求的激增,中国液冷服务器市场快速增长。根据IDC发布的《中国半年度液冷服务器市场(2023上半年)跟踪》报告显示,2022年中国液冷服务器市场规模达到10.1亿美元,预计2023年全年将达到15.1亿美元,2022-2027年,中国液冷服务器市场年复合增长率将达到54.7%,2027年市场规模将达到89亿美元。
图10 中国液冷服务器市场规模及预测(来源:IDC中国)
图10 中国液冷服务器市场规模及预测(来源:IDC中国)

1、绿色算力需求激增,液冷服务器行业迎来春天

       当前,金融、互联网、电信、能源等数据中心密集型行业,对液冷服务器的需求在逐步释放,为液冷服务器产业带来巨大的市场空间。随着液冷技术的不断成熟和应用,液冷服务器市场将迎来新的增长点,液冷服务器的核心组件包括冷却液、冷却系统、服务器硬件等的开发与生产将受到重视。因此,绿色算力需求的激增,与此相关的产业链各环节也均将受益。

       然而,完善的标准是产业成熟的关键一步,目前液冷服务器标准化工作正在逐步推进,但整个行业的标准化程度仍较低,涉及液冷部件及接口层、液冷机柜、组件、换热设备、室外集成冷源等多方面,产业链上各个企业技术路径各式各样、产品设计迥然相异,产品质量参差不齐,由此导致液冷进行标准化适配和部署的难度很大,因此需要产业链上下游的协同推进。

2、冷板式液冷服务器占主流,一体化交付模式成为主导

       当前主流的液冷技术包括冷板式液冷和浸没式液冷。因受到服务器本身及浸没腔体等设计高要求的制约,进行浸没式液冷的改造成本和改造难度过高,而应用冷板式液冷仅需加装冷板、CDU,拆掉风扇等,因此短期冷板式液冷服务器占主流。据IDC数据显示,2023上半年,中国液冷服务器市场中,冷板式占到了90%。

       值得一提的是,针对冷板式液冷而言,当前有解耦交付和一体化交付两种模式,解耦交付即液冷机柜与液冷服务器之间遵循用户预先制定的通用接口设计规范,可由不同厂商负责生产和交付;一体化交付则是液冷机柜、服务器等所有部分均由同一厂商进行集成设计并一体化交付。当前主要是一体化交付模式,随着液冷技术逐渐实现产业化和标准化,有望向解耦交付模式转变,这一模式便于液冷产品的灵活部署,形成统一的标准及规范。
图11 液冷不同交付模式示意图(来源:冷板液冷服务器设计白皮书)
图11 液冷不同交付模式示意图(来源:冷板液冷服务器设计白皮书)

3、服务器厂商锐意进取,液冷产品迭代速度加快

       在绿色算力发展要求下,液冷服务器得到了广泛的应用,国内越来越多的主流服务器厂商加大研发力度并加快液冷产品迭代速度,包括华为、浪潮信息、联想、中科曙光、中兴通讯、新华三、超聚变、宁畅等

       在液冷技术方面,华为主要是布局冷板全液冷系统。早在2017年就推出了Fusion Server高密专用液冷系统,随后发布Fusion Server Pro冷板全液冷系统解决方案,采用密闭式全液冷机柜设计。当前,华为全液冷系统的应用产品包括FusionServer Pro E9000融合架构刀片服务器、华为FusionServer Pro X6000高密度服务器等。

       浪潮信息作为“All In 液冷”的服务器厂商,已拥有百余项液冷技术领域核心专利。2022年,浪潮信息发布全栈液冷产品,通用服务器、高密度服务器、整机柜服务器、AI服务器等四大系列均支持冷板式液冷,同时浪潮信息亚洲最大液冷数据中心研发生产基地——天池正式投产,年产能达到10万台,实现了业界首次冷板式液冷整机柜的大批量交付。

       在服务器领域深耕多年的联想集团,早在2012年就开发出了在业内独树一帜的温水水冷技术。经过十余年的迭代更新,2023年6月,联想最新推出的第六代海神温水全水冷技术,可实现服务器全水冷无风扇设计。

       国内液冷先进计算的领导者中科曙光,经历了“冷板式液冷技术”、“浸没式液冷技术”、“浸没相变液冷技术”三大发展阶段。2023年8月2日中科曙光子公司曙光数创发布了“冷平衡”战略,是特别针对数据中心算力、成本、能耗三元平衡问题,推出的全栈液冷数据中心技术与全生命周期一站式服务。

       中兴通讯作为全球领先的综合性通信解决方案提供商,前瞻性布局ICT液冷一体化解决方案。2023年1月份,中兴通讯推出的G5系列服务器,支持不同的冷板式液冷方案,如CPU液冷,CPU+内存条液冷,以及CPU+内存条散热+VR液冷。

       新华三是国内最早投入液冷技术研发的企业之一,在液冷服务器上有着多年的技术积淀。当前,新华三践行“ALL in GREEN”战略,发布全栈液冷解决方案,为H3C UniServer G6系列服务器、H3C CR19000核心路由器、H3C S6850接入交换机等产品提供冷板式技术方案或浸没式技术方案,同时根据客户不同的业务场景,提供液冷机柜(包含Manifold、配套管路)、分布式/集中式CDU的液冷数据中心整体解决方案。

       超聚变原为华为x86服务器业务,2021年11月从华为剥离,单独运营。作为新生的算力产业龙头,超聚变积极布局液冷技术,2023年1月,超聚变推出FusionPoD for AI整机柜液冷服务器,它通过高效冷板与无源水冷背门相结合的设计,可实现100%全液冷。

       新锐服务器品牌宁畅从定制化服务器的细分板块切入实现高成长。AI算力兴起之后,宁畅抓住液冷替代风冷的机遇,接连推出B5000 LP冷板式液冷服务器、B7000浸没式液冷服务器等产品,实现液冷产品研发、测试、生产、交付全链条覆盖。依托液冷全系统方案,2023年6月,宁畅针对不同客户需求推出“无忧液冷计划”,提供定制化服务。

总结

       液冷服务器解决了传统服务器风冷散热不足、环境适应能力不强、能耗较高、噪音过大等问题,因此应用前景很光明。然而液冷服务器具有较高的技术壁垒,涉及冷却技术、制冷系统设计及仿真技术、液压和流体动力学技术等多项技术领域,企业在设计与应用过程中需要深入掌握液冷技术的相关原理。随着技术的不断进步和创新,液冷服务器在未来将发挥重要作用,为服务器行业带来更多的发展机遇。

参考文献

       [1]中兴通讯.中兴通讯液冷技术白皮书[R].2022
       https://mp.weixin.qq.com/s/4_kgSAp9N-Yr6J80RlEoAw

       [2]开放数据中心委员会.冷板液冷服务器设计白皮书[R].2023
       https://it.sohu.com/a/729246332_121666210

       [3]中国移动、中国电信、中国联通.电信运营商液冷技术白皮书[R].2023
       https://mp.weixin.qq.com/s/e41kEJ11hbsCl7ch82T9tw
责任编辑:吴婕
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。
读者评论 (0)
请您登录/注册后再评论