算力需求大爆发,高能耗难题何解?

更新时间:2023-09-16 00:11:01作者:无忧百科

算力需求大爆发,高能耗难题何解?

21世纪经济报道记者 缴翼飞 北京报道

作为一种新型生产力,算力已成为推动数字经济发展的核心力量,正强有力地支撑数字中国建设。在碳达峰碳中和目标引领下,如何进一步推动算力绿色化发展,实现绿色算力升级,是实现经济社会高质量发展的必然选择与关键环节。

9月12日-14日,由工业和信息化部新闻宣传中心(人民邮电报社)、中国邮电新闻工作者协会等单位联合组织的“算力中国行”大型调研采访活动走进上海。

21世纪经济报道在与当地运营商、企业、有关专家探讨中发现,伴随算力规模爆炸式增长,如何处理数据中心“快发展”和“高耗能”之间的矛盾变得越发急迫。目前从地方到企业也在尝试优化制冷系统、加强应用环节效率、完善能效评估体系等多种举措,积极绿色算力发展提供了更多的行业参考。

降能耗不能忽视制冷系统

国际能源机构(IEA)的数据显示,2022 年全球数据中心用电量为2400~3400 亿千瓦时,约占全球最终电力需求的1%~1.3%。根据中国信通院统计,我国2022 年数据中心能耗总量1300 亿千瓦时,同比增长16%,预计到2030 年,能耗总量将达到约3800 亿千瓦时。

目前业内普遍认为,从能耗构成看,数据中心总能耗包括IT设备、制冷系统、供配电系统、照明和其它。制冷是IT设备之外的最大耗能源。因此,优化制冷系统成为数据中心提高能源效率的重要环节。

在上海移动临港IDC数据中心里,“全副武装”的新型微模块机房成为一个个节能环保的“绿色单元”,记者走在通道中也感受到了明显的低温凉爽。据工作人员介绍,在上海移动临港数据中心,临港数据中心的末端机房采用微模块R18标准建设,符合数据中心未来发展要求的模块化、标准化、低碳化的智能管理要求,可实现节能减排、化整为零、方便运维的管理效果。

“相较于传统机房,微模块通过最新的冷通道封装技术,加强了供冷效率和换热效率,再加上水冷空调的应用以及智能化空调群控系统的采用,大大提高了微模块供冷的能效比。”该工作人员说。

除此以外,上海移动还采用机房制冷精细化管理模式,在秋冬季节利用大气自然冷源代替冷机机械制冷,在夏季供冷高峰时期通过智能监测室外环境温度和末端供冷需求量,通过冷机,水泵,冷却塔风机动态变频调节模式运行,全年可节电超过200万度。

值得注意的是,液冷、间接蒸发冷、全变频氟泵等先进技术正逐步应用于数据中心,均可有效减少数据中心制冷方面的用电,提升制冷效率,助力PUE值持续降低。

国内三大运营商中国移动、中国电信和中国联通今年6月发布的《电信运营商液冷技术白皮书》中也指出,目标2025年50%以上数据中心项目应用液冷技术,电信行业力争成为液冷技术的引领者、产业链的领航者、推广应用的领先者。

记者在燧原科技还看到了采用冷板式液冷方案的云燧智算机,可组建面向超大模型的算力集群,刚刚在2023年中国算力大会上被评为“算力中国·年度突破成果”。目前,燧原科技已在之江实验室建成了千卡液冷训练集群,在提供超过100P国产AI算力的同时,还将PUE可降至1.1以下,实现了高算力和绿色化的结合。

《2023中国绿色算力发展研究报告》预计,到2030年,液冷技术规模落地后PUE接近1,单位能耗碳排放随着绿电在电网中占比不断提高将有所下降。

上海市通信管理局信息通信发展处副处长魏征告诉记者,目前上海正在推动液冷、间接蒸发自然冷却等节能技术的应用,并在嘉定、青浦等地区的算力中心开展试点。同时,还在推动数据中心企业启动氢燃料电池等绿电在数据中心的试点,梳理了上海10个“小散老旧”数据中心(约4000个标准机架),预计将于年底前全部完成数据中心改造任务。

值得注意的是,不少企业正在尝试运用利用AI来实现架构和算法上的优化,以最大限度地利用活动设备,并将不需要的设备置于深度空闲/低功耗状态,以提升使用效率,降低电量的需求。

蚂蚁集团首席技术官、平台技术事业群总裁何征宇告诉记者,算力是由数据中心的服务器提供,但实际上大量的电能只是用于维持服务器在正常运转,并没有提供直接的计算服务。根据统计数据,在目前的数据中心里,可能只有6%-12%的电能是真正用于计算本身。

他进一步指出,不同类型业务在不同时段存在业务量潮汐波动属性。例如,在线服务类业务具有高敏感和低时延的属性要求,离线计算(如AI 模型训练、数据挖掘等)对时延和敏感性要求低,但对计算能力和存储空间要求较高等。由此,不同工作负载类型对硬件算力需求不一,如在线业务CPU 利用率不高、离线计算CPU利用率高、智能计算业务对于CPU 要求不高但对于GPU 要求高等,都给异构硬件算力资源的采购、调配和复用等带来一定挑战。

据了解,蚂蚁集团2022年的服务器CPU效率已经从2017年的不足10%,提升到了33%。未来随着智算需求的提升也会在GPU方面作进一步的尝试。

能效评估体系仍有完善空间

作为衡量数据中心能效水平的重要指标,PUE成为近年来行业中最为人耳熟能详的热词。

近年来,国家和地方发布多项政策不断推动PUE值的降低,2021年11月,国家发改委联合网信办、工信部、能源局共同发布《贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》中提到,全国新建大型、超大型数据中心平均电能利用效率降到1.3以下,国家枢纽节点进一步降到1.25以下;工信部印发《新型数据中心发展三年行动计划(2021—2023年)》提出,到2023年底,新建大型及以上数据中心PUE降到1.3以下。

在调研走访过程中,很多企业均表示,不同于自然冷源对西部PUE降低给予的极大助力,上海地区的机房能够满足PUE达到1.3以下的条件,但也面临着不小的成本压力。

“目前智算中心建立落地以后,前期的服务器的功耗由原来的将近不到1千瓦,现在大概在11千瓦的水平。在这种情况下,实际上对能耗的指标的需求也会越来越大,希望能在能耗指标等政策上给予统筹支持。”一位运营商如此说道。

事实上,数据中心服务器运行的过程中会产生大量热能,水冷目前成为东部服务器比较普遍的方法,这也会造成较大的水力消耗。

目前,绿色计算相关行业组织及相关标准主要的关注点都在于数据中心及其相关设施能效,提出包括电能利用效率PUE、水资源利用效率WUE、碳利用效率CUE 等被行业普遍采用的指标。但对于算力应用环节的效率评估,行业尚缺乏通用指标。

何征宇认为,当前行业比较关注数据中心的绿色度指标,并且已经制定了一系列比较成熟的评价指标及相应的评估体系,如电能利用效率PUE、水资源利用效率WUE、碳利用效率CUE 等,都在推动数据中心绿色化过程中发挥了巨大作用。同样,面向应用环节的计算绿色化,也需要制定出相应的评价指标和评估体系,才能有效帮助算力应用企业一方面更好评估自身当前算力效用水平,另一方面也可以更好的评估出在该领域的投入产出效果。

也有部分企业建议,未来的产业政策中可以在能耗指标上向智算中心有所倾斜,同时优化绿色能源的能耗管理方式,对于在数据中心所用的绿色能源,不再纳入能耗总量和强度控制,用能管理逐渐从能耗“双控”向碳排放“双控”转变。

本文标签: 算力  电能  机房  服务器  高能耗