算-电-热-碳视角下算力中心多要素协同的机制、技术与模式

科技   2024-11-04 11:50   北京  

摘要

日前,在由华信咨询设计研究院有限公司暨中国通服数字基建产业研究院联合CDCC主办的第十三届中国数据中心设计高峰论坛上,北京理工大学机械与车辆学院副教授、博导,碳中和系统工程北京实验室主任助理 王永真,以《算-电-热-碳视角下算力中心多要素协同的机制、技术与模式》为题讲解了算力中心如何推进算电热碳多要素协同,技术与模式应该如何,为促进算电协同提出宝贵的前沿的观点。


01-算力-电力—热力协同的背景、基本逻辑与政策

能源物质和信息是人类社会发展的基本三要素,我国作为发展中国家,能源和信息使用当量仅是发达国家的1/5-1/3。

停电严重还是停信息严重?很多答案是停电,但如果现在让大家断网,大家也不好受。在国际社会停电事故非常多,但中国电网以其高可靠性服务了千家万户。

现在信息所处的背景是什么?以前学的课本上的物理模型,那些公式因果关系,Y等于Fx,那个F好像能表达出来。现在变成什么?相关分析,很多数据出现了,通过机器学习、深度学习、AI模型找出相关分析,但是不知道那个公式怎么写,甚至不需要,但这里出现很多的数据,预训练数据、推理数据,大模型已经到来,这里很多跟数据相关,数据运载需要耗电,ChatGPT的耗电非常清晰。
大模型虽然有意义,很便捷,但在伦理上、隐私上等等还有很多风险我们需要攻破。

数据中心用电量到底是多少?数据肯定会增长,毋庸置疑,基础设施肯定会建设,智算特别需要,全球来看,数据中心用电量到底是多少?有不同机构的测算,最小值和中位数差很多,未来预测差更多,但增长会非常快。如果说量子计算实现,2030年说不定还减小,都有可能,所以说这个AI是红的还是绿的,没有统一说法。

就不同国家的用电量来看,爱尔兰电耗占比达18%,我国在3%左右,相对其它行业,以前的数据中心用电量很小,但近些年数据中心三高问题得到国家和行业的密切关注。

我们还有三低问题,低的上架率,低的利用率和低的空间利用率,这三低和三高围绕数据中心。

数据中心芯片一直在发展,算力效率很高,增长大概几十倍,但功耗也在增长,单个芯片能突破一千瓦,很多企业总说,算力尽头是电力,电力尽头是热和冷。数据中心芯片功耗越来越大,单位面积没变甚至减小了,散热密度提升了很多。2015年-2023年,信创芯片也提升了很多,功率能到400W、500W,芯片面积没变的情况下,基于传热系数,风冷扛不住了,理论上80千瓦的风冷也能扛得住,但80千瓦以上必须上液冷,所以传热系数和散热密度决定技术革新。

数据中心在电力系统里,既然叫算电系统,在里面是什么样的特色?电力系统以前是传统电力系统,大家需要多少电,电网调度,维持50赫兹,发给火电厂调度,火电厂说你需要10兆瓦,那我给你发是没问题的,但随着新能源在需求侧的注入、渗透,越来越多问题出现,用户侧的负荷出现不确定性。新能源是波动的,储能成为一个很好的解决方案,但储能投资很高,一直降不下来。现在需求侧响应出现,源网荷储出现,什么意思?通过需求侧荷侧灵活性响应源侧的调度,数据中心在哪里?数据中心在荷侧,用户侧、需求侧,数据中心里面灵活性到底有哪些?和电网能产生一些化学反应,共同去维持信息这种消费和电网高可靠性,这是基本逻辑。

从2020年国家能流图可以看到,电气化率只有25%,终端蒸汽、供热的用热占比接近74%,蒸汽在很多领域应用,比如纺织、半导体、电解铝等,煤化工都需要大量蒸汽,建筑也需要大量冷和热在夏季和冬季。智算之后,液冷出现,数据中心余热温度不像以前很低,提高之后再创造一些价值去替代余热,清洁的热、废热产生用能用热的清洁化和替代。

数据中心相对其它行业有很多特点和特征,我们单位功率很大,单体建筑能量密度极高,同时余热量大,但品位温度低。

数据中心中有很多闲置资源,没有每天没小时出力,柴发油机,UPS的储能,还有它的蓄冷蓄热装置,都是大量的重投资,沉没成本,当然属于安全。所以说50174注意到新变化正在改,也带来很多新机遇。

现在是综合评价阶段,国家绿色数据中心,包括这几个企业给的几A大家可能都挂牌了,里面对绿色能源的消费,对能源综合利用,对源网荷储都各有密切关注,是一个综合评价方案。数据中心把电能消费掉,信息输入和输出的概念,现在里面打开之后发现很多事情。

数据中心特别是运营商比较关注出海走向国际,ESG非常重要。

国际几个大厂的排放,黑色的都很小,我们国家两个,黑色的相对突出很多,范围1和范围2的排放,我们进行一些革新。国际上为什么少?新能源自建电厂和绿电绿证的交易,国家立了一个课题,已经把数字基础设施里面的数据中心和5G同等和其它行业看重了,这里的布局不是本体,国家布局在哪个地方,和资源就业气候活动相关。

我个人做理论,也希望把一些想法推到工程上去。上游中游下游数据中心三个环节在建设运维规划包括其它方面,都是脱钩或者孤立规划,几个部门之间没有形成联动,系统化思维,把上中下游解决排放问题,包括下游高效散热以及余热回收,得到国家非常多重视。

以前叫算力+能源,更早之前叫信息+能源,实际上能源本质无非是电力和热力,所以说算力、电力、热力协同,三力协同,围绕碳的驱动,如何去满足,是每个人都应该参与进来的事情,与大家密切相关。

以前国家电网公司、南方电网公司,蒙西三大电网从来给数据中心供电,不会产生什么协同,从今年开始电力算力的站位不一样了,颠倒了,他们希望数据中心产生一点化学反应,和他们一起。

从微观上,每天我们的设备、机架、上层IT,下层OT的设备配电柴发,里面真正的协同两个点,一个点是温度、进风、回风包括冷却水的温度,这些能不能柔性调节,产生和电网互动的潜力。

第二是机架里的服务器,算力能不能被灵活调度和价格激励形成协同。

跳出来机柜之后,数据中心看园区级,上游、中游、下游,这三个环节能不能被打通?现在很多数据中心不是孤零零处在,周边还有很多用户包括化工企业,包括本址的风电、光伏形成算电热协同,形成产销型数据中心,我们又是消费者又是生产者。

宏观上就是东数西算,这里的算力指的是什么?算力是广义的算力,算力、运力和存力和电网、热网产生密切相关。这里面很多关键技术是什么?我们看第一个,上中下游打通了,设备很复杂,我们能源系统拓扑架构,设备大小,每天处理多少,这是一个非常复杂的问题,需要用数学方法解。包括宏观的,还有介观的,你要打破OT侧、IT侧,解这个问题开发一套软件解。要知道这些设备怎么连接,选多少台?每台多大?每天处理多少,同时满足不同目标去解。因为数字问题,也不好讲,开发一套软件,软件能够满足几个功能,园区级的数据中心包括其它工业园区,负荷预测,用算力的负荷,随着大模型能预测出来。功率预测,指标选取,系统建模,容量规划、运行调度和绩效评价都会有一些。


02-算力-电力—热力协同的原理及关键技术

未来能源价格,数据中心用的是两部制,电价不一样,但未来电价现货之后,现货就是商品,电价会随时波动,而且波峰和波谷电价的高值和低值差别非常大,欧美市场就是这样的。

业主包月算的,未来随着个性化的算力服务,它的负载率,就是数据中心每小时计算的任务量大小会波动,负载率波动会影响服务器功耗,虽然有额定功耗,同时影响IO设备的流量,流量变了之后它的功耗也会变,供电设备,UPS储能的效率也会发生变化,功耗也会变,同时制冷系统,它的COP和功耗也随负载率变化,不是线性的是有最优值的,我们找到最优值,单位算力的算效,单位算力的功耗比较小会出现最优值,同时看到峰值被缩减,如果采用算电协同,IO设备峰值,峰值从这儿降到这里,同时IT设备减少了电网容量压力,容量电费很高,同时我们知道,芯片到底运行在高温还是低温下也存在CPU温度最优解,后面的进风和回风进行柔性调节存在最优解,未来很多智算进入之后,我们看服务器级别,普通计算基本上不动,用电数据,用电量,功耗,但是你看大模型,这种随机波动还是很多的,同时看集群波动更多。

柴发互济是不是解决方案。我们来自北理工,我们还做车辆里面的发动机,高功率的大功率的,我们现在还做氢内燃机,氢燃料电池替代柴发解决排放问题,但那个链条很长,氢能问题很多,属于前期阶段。

国际社会有很多例子,把其它地方的算力跨数据IDC跨到别的地方算,东部算到西部,用便宜的电去算,有一些示范工程做一些。

第二个关键,算力跟热力之间。我们有一句话,制冷的人和暖通的人在一起,低温的热就是冷,数据中心需要冷,数据中心也放热,所以说冷力也会出现。

行动计划里有几个关键,一个是我们寻找免费的IOG冷能和数据中心结合,这属于算热协同。比如在大湾区,接驳站,天然气接驳站,比如唐山天然气接驳站,液化天然气会吸热,那种低温比我们天然海底比自然风冷低太多了,那种低温怎么和数据中心结合已经写进国家政策。

还有最传统的数据中心这么多设备会放热,以前温度特别低,根据能量守恒虽然占比很多,但温度很低,耐温只有85度,我们一次性进回风的温度只有30以下甚至十几,以前的技术觉得这是一种废热,根本用不了,但技术总在进步,我们看余热回收的方式有三类,最想得到用热量来发电,就是电厂,煤燃烧之后热量来发电,但电厂那个是700度蒸汽温度,咱们只有70度以下,30度,不可能,经济回收太差。余热被压缩式热泵提升之后,20、30度,40、50度能变成70、80度,100多度,这时候余热品位就高了,压缩式热泵技术。还有热直接能变冷,因为数据中心余热在液冷之后可能会提高到60、70度,50、60度。50、60度的热能不能产生冷量?吸收式制冷,吸附式制冷的方式都会有。

数据中心周边如果有近距离的用户,需要用热,冬天用热,通过热泵给它提供供热,但建筑夏天不用热,夏天数据中心还在放热,所以我们就想了一个方案,用土壤把夏天的热给它储存起来,再通过二氧化碳的热泵给它放进去,也吸收了夏天的热,这种储能方式因为不像电化学规模化之后全球认知最便宜的储能技术,就是土壤,一切源自于自然,只是换热面积会大一些,属于跨季节的长时储能。

我们看第二个风冷,确实温度很低,7-18度,18-25度空调送风。如果直接上液冷,液冷末端,液冷达到30、40度,40、50度,50、60度也有,这种余热放在热泵模式下作为热泵的蒸发端,我们热泵把低温的热提升到高温,这时候热泵COP不是空气源热泵或者液冷机组的3、4、5、6,它能到10以上,这时候能效比就非常之高,所以我们要尝试开发一些样机。这边产生什么?用数据中心余热能够在冷凝端热泵出口产生130度以上的蒸汽,刚才我们说的我们国家是一个重工业行业,里面有很多蒸汽需求,大量蒸汽能替代热泵,数据中心和周边工业有机结合协同起来。但它的核心是什么?压缩机技术,这里边最贵就压缩机,你要把低温的热提升到高温去,压力差比较高,压缩机就是卡脖子的技术。我们可以看到大量蒸汽会出来,直接满足工业,现在工业企业大量用蒸汽,工业企业就用电锅炉、燃气锅炉,燃气又很贵,电带碳排放,所以碳排放会驱动一些新技术。

余热制冷,液冷设备假设出来60、70度的一次侧的温度直接能产生5-10度甚至更高的一些制冷,它原理是什么?没有压缩机,它非常安静,通过吸收和发生过程,热驱动一种溶液产生,电驱动压缩机产生压差,热驱动也能产生压差,只是热效率差一点,所以说它COP是比较低的,但我们免费的热,边际成本为零,所以它未来的潜力非常大,同样做吸附式的方式做小试。


03-算力-电力—热力协同的挑战与未来

我们看这里面有很多新技术,又比较复杂,链条比较长,我们目标是从能源视角实现整个能源系统在数据中心参与的时候,整个能源系统能效最高,全要素生产率提升做整个设备1+1大于2。

从信息视角,算力网、电力网、热力网要协同起来,整个能效提高,绿色低碳,毋庸置疑,最终结的目标是什么?就像电价一样,电价还是有点贵,我们国家是倒挂,欧美电价更贵,我们希望把工商业电价降低一点,但工商业可能会升高,工商业倒补了居民的电价。实际上最终是这里面,共享普惠。我们希望我们的算力服务,一方面让我们的信创的IT侧降价,同时算力服务侧降价,实现普惠,算力服务普惠如何构建是终极目标。

所以说三力协同有很多方法,有的设备模型我们知道,有的设备需要启用大数据,系统化思维,物理驱动和数据中心驱动都会一起来发力做这些。里面有很多问题,技术本身的问题非常之多,电热泵的问题,吸收式制冷的问题,源网荷储的问题更为严重,多少电价才能刺激数据中心在不考虑安全参与新型电力系统?因为会丢工作岗位,安全运行责任重大,保证安全情况下,安全是一个红线,如何让角色者办这个事情,特别是运营商首先你要告诉技术细节控制什么,设备的模型,能保证100%安全。

出来一些机制,在商业模式你给我多少电价多少热价才能投这个设备,我们正在做大量测算和说服,也在给国家提很多政策意见。

关注我们获取更多精彩内容


往期推荐

● 相约北京 直面AIDC变化与未来 | 2024数据中心标准大会报名正式开启

● 【直播预约】11月7日 CDCC直播间 再谈智算中心关键网络

● 4年后将成东盟第一!CDCC专家解读马来西亚数据中心热潮

● 探秘全球最大GPU集群,20万GPU超算在路上

CDCC
数据中心标准、技术沟通交流平台
 最新文章