高质量算力,“先手”人工智能大棋局

科技   科技   2024-01-03 18:04   北京  


“当这个时代到来的时候,锐不可当,万物肆意生长,尘埃与曙光升腾。江河汇聚成川,无名山丘崛起为峰,天地一时无比开阔。”这是来自《激荡三十年》里的一段文字。

放在今天,我们的时代充满了AI的色彩,“天地一时无比开阔”仿佛就在眼前。AI正在引领人类的第四次工业革命,有可能带来一个完全颠覆的时代。



未来会是什么样的呢?这个问题的答案取决于我们现在做了什么。对于许多行业和企业,"数字化战略"早已不是什么新鲜事物,现在需要谈论的是“人工智能战略”。 

围棋看位势,象棋看攻防。人工智能的大棋局中,如何布局“先手”优势?


算力“新大陆”


2023 年 12 月份,中央经济工作会议阐释了“新质生产力”的概念,新质生产力代表的是一种生产力的跃迁,涉及领域新、技术含量高。这意味着,依靠科技创新驱动的战略性新兴产业和未来产业创新发展,将成为推动构建现代化产业体系的关键力量。 

数字经济时代,算力逐渐成为新质生产力的重要基础动能,是拉动国家经济增长的核心引擎。《2022-2023全球计算力指数评估报告》显示,15个重点国家的计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.6‰和1.7‰,预计这一趋势在2023-2026年仍将继续。

算力作为新兴生产要素,能够对经济发展的长期增长提供一股强大的推动力。在产业数字化和数字产业化的初期阶段,算力资本和算力服务所带来的高边际收益率能够加速实体产业与数字产业的融合,产生更大的效益。并且,产业间的协调发展也将进一步优化算力资本与算力服务在产业中的配置,形成算力与产业间的双向正循环。对此,清华大学全球产业研究院副院长李东红表示:“经济的高质量发展对算力提出更高要求,算力作为新型基础设施,在支撑数实融合方面发挥了重要作用,将推动已有产业、企业迈上一个新的台阶。”

2023年,AIGC驱动的新一轮AI浪潮对智能算力的需求已经从科研和教学领域,逐步转向产业应用领域。IDC数据显示,2022年,中国AI加速服务器市场出货量排名前五的行业领域分别是互联网、服务、政府、教育和金融。随着人工智能技术的不断应用拓展,不同行业的算力需求结构也将随之演化。在这样的情况下,如何有效地管理和使用这些算力资源就显得尤其重要。

作为计算产业的引领者,浪潮信息近日首次提出“高质量算力 ”的概念——采用先进的计算架构,提供高算效、高能效、可持续、可获得、可评估的新质生产力,有效推动数字经济与实体经济的深度融合,实现经济社会高质量发展。



需要特别指出的是,“高质量算力”并不等于“高算力”。对此,浪潮元脑首席技术官张东表示:“只有真正符合用户的性能需要,利用率高、能源效率高、可持续获得的算力,还要综合成本低且使用方便,这才可以算得上是高质量算力。”


算力场域里的“五边形战士”


2023年10月,工业和信息化部等六部门联合印发了《算力基础设施高质量发展行动计划》,计划提出了完善算力供给体系、提升算力运载能力、加强存力保障、深化算力在行业应用中的作用、促进绿色低碳算力发展、加强安全保障能力建设等六个主要任务,以推动算力基础设施的高质量发展。此外,计划还提出了2025年建立50个智能计算中心等具体指标。在计算力方面,预计到2025年,其规模将超过300EFLOPS,智能算力占比达到35%。

其实早在2018年,浪潮信息就提出了“计算力就是生产力”的理念。高质量算力是浪潮信息继2020年4月首次提出“智算中心”理念之后,在计算产业的又一次引领。

然而,旧地图找不到新大陆。高质量算力是一场认知与思维的升级,高算效、高能效、可持续、可获得、可评估共同构成了高质量算力的五大特征。正是这些特征场域内的攻守与平衡,将高质量算力打造成了在通往数智未来的“五边形战士”。



高算效:解决供需矛盾


截止到2022年底,我国算力总规模为180EFLOPS,全球排名第二。然而整体算力利用率却不足30%,部分算力实际性能不足一成。

实际上,所谓“性能”并非理论上的每秒运算次数,而应该看具体应用场景下的实测性能,比如,单位时间内处理的Token数量、运行时延、模型训练时间、数据处理质量等指标。

因此,浪潮信息提出应该以系统设计为核心,围绕生产、聚合、调度、释放算力四大关键环节,全面提升算效。具体来看,可以通过整合高性能部件,打造多元异构的强大算力机组;消除网络与存储性能瓶颈,进行集群性能调优;高效调度、断点续训,确保平台长时、稳定运行;通过丰富的框架、工具,及算法优化,加速应用落地。

在追求实测性能与资源利用率的双重之路上,浪潮信息已经“开跑”。基于“源2.0”开源大模型,浪潮信息组建的千卡集群平均计算峰值效率可达54%,是业界平均效率的1.8倍;断点续训自动训练恢复,故障处理时间小于5分钟,是业界平均故障恢复时间的1/6。

高能效:平衡能耗与算力输出


数据中心在提供算力的同时,也面临着巨大的能耗和环保压力。目前,我国在用数据中心机架总规模已经超过650万标准机架,在用数据中心能耗总量达到1300亿千瓦时,占全国总用电量的2.7%。

数据中心的能耗主要来自IT设备、供电设备及制冷设备。据统计,2021年,全国数据中心二氧化碳排放量为7830万吨,而IT设备能耗是数据中心能耗和碳排放的主要来源。以PUE为1.5的数据中心为例,供电、制冷等配套设施能耗仅为IT设备能耗的一半。

目前,业界对于衡量配套设施节能水平的PUE指标关注度较高,但对主设备的能效标准设定、数据中心算力算效能耗比的关注度却并不高,对IT设备能效也缺少测度、评估和监管机制。

数据中心的绿色低碳是长期任务。算力全生命周期都存在碳排放,评估时还应考虑从采购到回收整个环节的碳足迹影响。也就是说,高能效不等同于PUE,不仅要关注能源、电力消耗,而是每单位碳排能产生的算力。张东透露,浪潮信息通过绿色采购、绿色设计、清洁生产、绿色包装和运输、绿色运营和回收处理的算力全生命周期碳足迹管理,使得每万台服务器节约的碳排放相当于植树5万棵。截至2023年7月,液冷数据中新的碳排放累计相当于植树231万棵。

可持续:生态与技术兼容


单一算力已经无法满足大量的计算和数据处理,从传统算力生态到人工智能算力生态,高质量算力发展更是依赖于庞大的供应链支撑,从芯片研发、算法优化到应用落地,每个环节都需要更为密切的合作,缺一不可。

高质量算力技术既有向“前”兼容,也要布局向“后”持续迭代升级。2023年4月,开放计算标准工作委员会(OCTC)成立,通过开放标准,在不同层次之间通过虚拟化、API等标准化方式对接,实现产业链整体标准规范。依托于组织里的产业上下游成员推动算力服务分层解耦,每层均可替代,构建高质量算力生态开放。

可获得:算力普适普惠


To B端的产业数字化需求对算力需求持续提升。互联网行业占算力需求39%,是算力需求最大的行业,政府服务、电信、金融等行业应用算力水平处于行业领先水平,教育、制造业等算力需求处于初期,发展潜力空间较大。

在To C端,到2022年底,我国5G网络用户超5.6亿,算力设备泛在化。移动互联网接入流量剧增也进一步带动算力需求,来自工业和信息化部的数据显示,移动互联网接入流量从2017年的246亿GB增长到2022年的2618亿GB,5年增长10倍以上。高清内容、视频传播、AR/VR、云游戏等新兴应用推动了算力需求大幅增长。

如今,AIGC的快速发展让算力紧缺问题更加凸显,同时,算力的应用场景日益复杂多样化。高质量算力要适应各种应用场景,才能更好地赋能千行百业。此外,算力用户激增,用户群正在从大型企业向普罗大众转变,当算力真正成为基础设施,高质量算力就具备了普惠的使用成本,让算力真正的人人“用得上、用得起”。

可评估:标准与工具结合


当前,算力评估体系通常局限于简单场景,多聚焦单一维度,对多场景下算力的能效评估缺乏深入研究与重视,无法全面、深入地反映算力应用的实际效能与发展潜力,也就限制了评估体系在指导高效能、多元化算力资源配置中的应用广度和效果。

目前,OCTC及中电标协正在着手建立相应的规范标准及测试工具,按照AI、云、大数据、虚拟化等场景需求,采集性能关键指标,建立多元算力算效评估规范完整、准确的算力评估体系。达到一套标准加一套测评框架输出多个评测指标的目的,满足市场对高效、可衡量和可优化的计算力解决方案的评估需求。



现在,新一轮的观念变革、知识刷新与能力升维已经来临。我们用大数据、人工智能技术去超越确定性问题、处理不确定性问题。“高质量算力”理念与发展路径的提出,着力点在于推动算力产业的高质量发展,解决当前算力产业存在的供需矛盾,满足智能时代的算力需求。


借用最近大热的电视剧《繁花》里的一句台词:只有看到未来,才会有未来。


 


大咖科技Tech Chic
聚焦科技领域,用财经视角穿透商业世界。
 最新文章