聊 10 句天 ,ChatGPT 要"喝掉"半升水来散热?

科技   2023-12-14 17:47   美国  

翻看美国大型科技公司最新的环境报告,可以发现一个共同点:它们的用水量激增


拒谷歌2023年环境报告显示,该公司去年用水量同比增长20%,达到56亿加仑(约合212亿升),近乎可以填满1.5个西湖。微软去年全年用水量同比增长34%,接近17亿加仑,大约相当于2500个奥运会泳池总蓄水量,21万人喝一辈子的水,还不够谷歌服务器用7个月。


科技巨头用水量激增的原因之一便是正在全球范围内迅猛发展的人工智能(AI)。


2022年4月18日,在美国亚利桑那州鲍威尔湖附近拍摄的干涸的泄洪道。图:新华社/路透


    ChatGPT有多能“喝水”?



加州大学河滨分校电气与计算机工程系副教授任绍磊的一项研究发现,ChatGPT每进行10到50次对话,就会“喝”500毫升的水,而每个月都有数亿用户在这个平台提问。

作为 Google Bard 聊天机器人的全新底层模型,(LLM)PaLM 2 想要获得成效就得经过高强度的预训练,参数越多,性能也就越好。公开资料显示,PaLM 2 是在 3.6 万亿个 token 上训练的,作为对比,上代 PaLM 也仅接受了 7800 亿 token 的训练。


ChatGPT、Bard 聊天机器人等大模型背后的数据中心本身就承载着传递、展示、计算、存储数据信息的功能。确,如此庞大的训练量也就意味着需要更强的算力中心。要让那成千上万张显卡稳定安全地提供算力,也同样得配备冷却装置来将空间保持在理想温度。


其中冷却数据中心最常用的方法就是蒸发和放空

蒸发比较好理解,就是冷却水蒸发汽化,间接带走服务器所产生的热量,这是水冷型数据中心耗水量的主要部分之一。除了通过蒸发失掉水分以外,数据中心会定期对冷却系统进行清洗,这也会消耗一定数量的水资源。

此外,与以往不同的是,近些年来,训练 AI 也成了数据中心耗水量的「元凶」之一。

谷歌去年增加的水消耗中的大部分就用于数据中心散热。数据中心的建造方式、所处位置以及采用的冷却技术不同,都会导致用于降温的耗水量有很大差异。



在低温环境部署数据中心是科技巨头降低散热成本的重要手段。


例如,Facebook在2013年就把一个热气腾腾的数据中心放到了瑞典北部,离北极圈仅一步之遥。



2014 年时,腾讯就在贵州凿出47万平的"七星洞" 用来当数据中心。


2017 年,华为在贵安新区造了个"云上屯",用来当华为云数据中心。

2018 年,苹果的 iCloud 数据也摇身一变成了"云上贵州"。

大家集体跑去贵州,一方面是贵州地价便宜、空气清洁、水电资源丰富,电费便宜,政策上也有不少相关的优惠。另一方面就是贵州四季如春的环境足够凉快和稳定,外界环境和数据中心本身的温差就足够大了,更有利于散热。


蒸发冷却技术是仓储式数据中心常见的冷却方案,即通过水的蒸发吸收空气中的热量。该技术耗电量少,且只须在一年中最热的月份使用。


与传统的风冷技术相比,如自然通风或空调降温,目前液冷技术被认为能够更好地降低PUE值(即电能利用效率,是评价数据中心能源效率的指标),达到节能减排的目的


按照液体与发热器件的接触方式不同,液冷技术大致分为冷板式(间接接触)、喷淋式和浸没式(直接接触)。浸没式液冷技术被广泛认为更具潜力,被称为"下一代热管理技术"。


数据中心成为“水战争”新战线?


世界上超过30%的数据中心均位于美国,根据弗吉尼亚理工大学的一项研究,运营数据中心是美国最耗水的十大商业类行业之一。

一些美国科技公司"偏爱"将数据中心设立在本就缺水的地方,因为它们看重那里低廉的电价和丰富的清洁能源。此举时常引发当地民众不满,更有媒体直言,这或将引发一场"水战争"。


这是2022年7月5日在美国内华达州埃科贝附近拍摄的米德湖。新华社发(曾慧 摄)


当美国亚利桑那州梅萨市议员珍·达夫得知Meta公司要在当地再建一座数据中心时,她立即质疑说:"我的第一反应是担心我们的水"。梅萨这座拥有50万居民的"沙漠城市"已经负载了谷歌、苹果等科技巨头的大型数据中心。


这一情况在常遇旱情的美国西部并非个例。


在俄勒冈州的达尔斯,与当地居民"抢水"曾让谷歌深陷法律纠纷,最终谷歌被迫公布其数据中心"霸占"该市超1/4水资源的信息;在新墨西哥州的洛斯卢纳斯,农民们抗议市政府允许Meta的数据中心进入。


研究人员说,一个大型数据中心每天的耗水量相当于一个1万到5万人口城镇的用水量。


除了对本土用水造成威胁外,美跨国互联网公司还试图将数据中心建在海外。今年初,谷歌宣布在乌拉圭南部建立数据中心的计划引发众怒并导致抗议活动爆发。乌拉圭共和国大学研究员丹尼尔·佩纳表示,谷歌数据中心使用的水都将直接取自该国公共饮用水系统,目前乌拉圭正遭受74年来的最严重干旱,首都蒙得维的亚已宣布进入供水紧急状态


在同样面临用水压力的智利,位于首都大区的基利库拉市受到科技巨头的青睐。谷歌早在2015年就在当地建成一座数据中心,后于2018年宣布扩建,这里面最为引人注目的当属驱动系统运行所用的285000多个AMD InfiniBand CPU和10000多个GPU。


如果数据使用仍以指数级速度增长,那么到2035年,全球可能需要建立10至20倍数量的数据中心,而水电便宜的拉丁美洲被IT行业视为这种扩张的“廉价场所”


美国向南半球"出口"数据中心不是一种经济机遇,而是一种新的剥削形式,即数据殖民主义"水资源消耗是一个重要的问题,但不是一个迫切的问题。所以不管是国家、企业还是科学界人士,都不会把环保问题置于安全和技术问题之上,牺牲一定的环保来保证竞争力增强可能是相当一段时间内AI发展的趋势"。


我国未来将建成全球首座商用海底数据中心


学术界的一个普遍看法是,能否突破现有大模型的结构、训练方式和所依托的硬件环境,向精简模型、小样本学习、低功耗计算等方向发展至关重要

重要的是要让企业和各国认识到,水资源保护是和技术发展同样重要的议题。同时,解决这一问题需要加强国际合作,国际社会要为人工智能发展设置"底线"。

目前国内外在解决AI耗水问题上已取得一定进展。11月24日,中国在海南岛附近35米深的海底完成"海底数据舱"的安装工作,未来这里将建成全球首座商用海底数据中心。



建设完成后,相较于同等规模的陆地传统数据中心,该数据中心每年能节省用电总量1.22亿千瓦时、节省建设用地面积6.8万平方米、节省淡水10.5万吨。


有观点认为,AI为水资源带来的不都是威胁。AI正改变我们的用水方式。它可以实时分析管道中的水流,在出现水泄漏等异常情况时发出警报或自动关闭,这是缺水国家避免水浪费的重要工具;AI还能实现"智能灌溉",是"下一代农场"高效用水的核心。


那么,AI到底会带来"水战争"还是"水未来"?


即便AI可以通过智慧水系统、智慧农业等优化对水资源的分配和管理,但训练AI模型所带来的水竞争问题仍没有得到解决。若一个公司有很好的技术处理水资源,这往往也代表它将占用更多水资源。


从长期来看,"水未来"还面临国际标准的竞争问题,即多大程度的AI运用于这种水循环和水再利用是可以被接受的,这又要参照哪个国家的标准?


可以说,"水未来"还取决于大国间的权力博弈。



科技赋能共创未来

京金吾
京金吾是以智能安防、军警仿真、反恐装备三大领域为基础,通过新形态的动捕技术,数字孪生虚拟仿真技术、大空间定位技术与高科技防爆安检技术服务于军警虚拟仿真训练、构建全数字仿真世界、无人装备模拟训练、防爆安检等领域。
 最新文章