中金在线 > 市场 > 市场掘金

|市场掘金

液冷市场步入快车道

证券市场周刊

|
  

作为算力的重要载体,AI服务器功率不断提升,传统风冷散热已经触及散热极限,并不能够满足AI服务器发展对散热的需求;另外,国家对数据中心PUE建设要求也越来越高,液冷技术成为替代风冷的最优选择,将进入快速发展阶段。

  

3月19日,在英伟达2024 GTC大会上,英伟达CEO黄仁勋发布了基于Blackwell架构的B200以及超级芯片GB200,并再次引爆AI市场。值得一提的是,英伟达宣称新芯片的算力能够达到20 PetaFLOPS,但这一性能指标是基于使用新推出的FP4精度,并采用液冷散热方式下测试得出的。因此,想要发挥GB200的真正计算能力,液冷技术是必不可少的条件。

  

对此,国内多家研究机构表示,英伟达的选择在业内具有风向标意义,这次发布会将成为液冷发展的重要推动力,液冷技术将加速替代风冷成为市场主流。

  

液冷将成为主流

  

AI行业快速发展,GPU替代CPU成为未来数据中心建设的主要方向。不可否认,前者在处理高密度数据方面优于后者,但其缺陷也显而易见,即GPU功耗显著高于CPU,且呈现快速提升的态势。

  

据开源证券研报,在后摩尔时代下,芯片制程技术发展趋缓,计算芯片多以提高核心数量的方式提高算力,这导致CPU、GPU的功耗不断攀升。具体而言,从2017年Intel第一代铂金至强处理器发布到2023年年底第五代处理器问世,芯片核心数量从早期的24颗提升至最多64颗,TDP从也150W提升至最高385W。

  

GPU TDP的提升更为明显,最早应用于人工智能计算的V100 Nvlink的TDP为300W,英伟达最新发布的GB200 TDP已经超过1000W,这已经超过风冷散热的上限800W。相比之下,液冷则凭借其优秀的散热能力满足了高功耗芯片的散热需求。

  

需要指出的是,不仅是单点散热,机柜整体散热方面也同样接近风冷散热极限。根据Uptime Institute发布的《2022年全球数据中心调查报告》,AI的高速发展导致数据中心机架功率提升,以英伟达DGX A100服务器为例,其额定功率为4KW,单机最大功率为6.5KW,一个标准的42U高度的机柜大约可以放置5个5U高度的AI服务器,依次计算,单机柜总功率超过20KW,而采用传统风冷散热模式通常可以解决12KW以内的机柜制冷,无法满足AI服务器机柜的散热需求。

加载全文
加载更多

精彩博文
×