“息壤”再升级,中国智算的再跨越

财富   财经   2024-12-27 16:05   北京  


AI智算的大国担当。


作 者熊剑辉
华商韬略出品ID:hstl8888


一场中国化AI变革,悄然到来。



当ChatGPT问世、大模型崛起,AI对算力的渴求开始变得永无止境。


如今,训练ChatGPT所需的英伟达GPU,可能飙升至3万张;ALL IN AI的扎克伯格,更是手握60多万张英伟达GPU……


在这场没有硝烟的战争中,谁拥有最强的算力,谁就能主导未来。


但在中国,情况有点不一样。


因为最大的挑战不是算力不足,而是算力异构。


据工信部等六部门联合发布的《算力基础设施高质量发展行动计划》,2025年,中国算力总规模将超300EFlops。


算力如此庞大,但算力结构,却并不尽如人意。


因为据《智算产业发展研究报告(2024年)》显示,2023年,中国算力总规模为230EFLOPS,其中“智能算力”仅70EFLOPS,占比30%。


即便中国在全球智算的“军备竞赛”倾尽全力,但预计到2025年,智能算力也仅能占到35%,“通用算力+超级算力”为主体的多元化算力格局,不会有大变。


一方面,智能计算需求暴增,智能算力不足;一方面,通用算力、超级算力占据主导。


这种情况下,如何构建多元算力网,让“通用算力+超级算力”参与到智算领域,才是最符合实际且迫在眉睫的大事。


但要把如此杂驳的算力融为一体,又高速智能地分配出去,谈何容易?


一是算力的底层芯片纷繁芜杂,从x86、ARM的CPU,到国内外的GPU、NPU、RISC-V,应有尽有。


二是超大的智算集群、超算节点、云计算中心,分属天南地北,难以直联互通。


三是其分属不同的企业、机构、部门,天然具备阻隔。


所以,这不但是一场巨大的技术挑战,更是超越技术的现实挑战。



而在跨服务商、跨架构、跨地域实施算力调度这三大顶级难题上,天翼云自主研发的一体化智算平台“息壤”做到了。


首先,“息壤”的算力极其强大。


其自有算力,就高达21EFLOPS;同时,海纳百川般接入50家算力合作伙伴,各类智能算力合计高达27EFLOPS。


这犹如一座规模宏大的“算力三峡”,具备聚溪成江、吞吐山河的“超能力”。


其次,“息壤”实现了对算力的一体化调度。


通过对算力网关核心技术的突破,再庞杂的算力,“息壤”也能化繁为简,统一、高效、云化接入;又通过算数协同、多级算力互联调度,实现了算数网的一体化调度,做到数随算走,算随数动,算力调度范围变得更加广阔。


第三,“息壤”实现了算力的全场景服务。


面向公共算力场景,百业千行都能获得天翼云充沛的算力滋润。


面向城市场景,天翼云已为深圳、北京、上海、苏州等多个城市构建城市算力网。


面向科研场景,天翼云能整合校内外的分散算力和超算平台,满足教学科研多样化的算力需求。


这意味着,天翼云“息壤”布下了一张“智算天网”,是算力调度不折不扣的大国重器。


而今,“息壤”更迎来全方位升级。


2024年12月3日,在2024数字科技生态大会上,天翼云正式宣布“息壤”一体化智算平台,在算网调度、智算服务、智算生态三方面全方位升级。


“息壤”已从算力互联调度平台,升级为集算网调度、计算加速、模型训推于一体的智算服务平台,并通过规模化商用,为各行各业的智能化转型提供支持。


实际上,纵横天下调配算力,远非“息壤”智算“超能力”的全部。



“今天有哪些行程安排?”


“今天的行程是这样的。”


话音刚落,一张行程表就出现在汽车中控屏幕上。


“帮我预定明天去上海的机票。”


“已安排。”


“接通远程会议。”


“好的,会议纪要将自动生成”。


……


一边开着车,一边用汽车语音助手,就订了票、开了会、安排了工作行程……


这不是科幻大片,而是A公司语音大模型打造的智能座舱,落地成为了现实。


车内是一个极端嘈杂的环境,多人语音、方言交杂,加上风声、车声,都会对语音交互产生很大影响;而人机交互也谈不上规范,有人会打断、有人会重复,有人还会说起来没完。


所以,要做出可用的智驾ChatGPT,相当不容易。


但运用“息壤”,A公司大规模调度出GPU、NPU、CPU等多种异构算力,高强度训练1个月,成功完成十亿级大模型阶段训练和效果评估。


结果,60多家汽车品牌蜂拥前来合作,效果相当满意。


现实中,不同行业的AI大模型,其参数规模正经历指数级攀升,从百亿、千亿飙升至万亿甚至更大。这种永无止境的进化,对算力平台提出了越来越高的要求。



而“息壤”,其名源自《山海经》,意为能自我生长、膨胀的土壤。


也就是说,它具备一种无限生长、持续进化的超能力。


现实确实如此。


在上海、北京,天翼云打造出两大“万卡池”,成为全国最早建成并投产运行的国产化、全液冷、单集群万卡公共智算中心。


而依托自主研发的“息壤”一体化智算服务平台,又实现了万卡资源纳管、万卡规模并行训练。


强大的技术创新,不止于此。


通过自研的算力加速、AI训练框架和断点续训能力,“息壤”使模型训练恢复时间,从小时级降低到分钟级,效率大幅提升。


这什么概念?


在超大规模计算领域,唯一可以确定的事,就是一定会发生故障。


根据公开数据,Meta在Llama3.1-405B大模型原生训练过程中,耗时54天,累计发生故障419次,平均3小时就要出错一次。


哪怕Meta这种顶尖科技企业,面对如此频繁的故障和中断,同样无可奈何。


但“息壤”,偏偏要挑战不可能。


在北京万卡池,天翼云对700亿参数的Llama2-70B大模型展开训练。


结果,得益于“息壤”强大的断点续训技术,故障被秒级检测,分钟级定位、处置、训练恢复,性能达到业界前沿水平。


这意味着,“息壤”不仅是超大规模算力的“调度大师”,还是可提供一站式高性能服务的“计算大师”。


凭借足以打通各类AI“任督二脉”的“专业能力”,“息壤”得以智润千行百业。


比如,针对某三甲医院临床研究所的医疗大模型,天翼云通过快速精调,实现了医疗大模型的临床辅助决策。


借助全栈适配工具链,天翼云助力某客户推出交通行业大模型,适配时间大幅缩短、训练性能大幅提升,30多个AI应用实现快速上云。


而为助力某时尚电商平台打造高性价比、高稳定性的AI生图工具——唯象妙境,天翼云在算力供给、存储、传输上提供全方位支持。


如今,这一强大AI生图工具,服务于全球近百万电商从业者,成为引领电商增长的新范式。


基于强大的国云智算底座,天翼云已服务于政务、工业、电商、医疗、教育等众多行业客户。算力在天翼云加持下,变得像水、电、气一样可随用随取。


但天翼云深知,仅靠自身一家,依然远远不够。



2023年,一个15岁的山东初中生在世界上最大的开源社区GitHub,启动了一个名叫Chat Nio的小项目。他的想法很简单,只为让自己的小伙伴免费体验ChatGPT的GPT4服务。


结果,这个开源项目迅速火爆。


2024年11月,有人出资百万,将其收购。


小小年纪就能获得七位数的第一桶金,这是开放社区赋予的魔力,也是强大生态带来的魅力。


AI产业的繁荣和发展,同样离不开生态沃土的“滋养”。


2024年8月28日,恰逢2024中国国际大数据产业博览会召开,天翼云的“魔乐(Modelers)开发者社区”正式上线。



这是天翼云智算生态建设的一小步,或将成为中国AI产业发展的一大步。


某种程度上,你可以将“魔乐”视为一个“智算雨林生态”


雨林,是地球上生物多样性最丰富的生态系统之一。它的生长、壮大,除了离不开阳光、土壤,更需要汇聚庞大多样的生物聚落。


如果说,算力资源是土壤,智算技术是阳光,那么天翼云的“息壤”已然足够丰富强大。


但独木不成林,“智算雨林”中,既需要植物这样的“生产者”来聚合能量,创造产品;又需要昆虫、鸟类、哺乳动物等“消费者”,将产品商业化,形成生态闭环。


哪怕是“生产者”,也既要有高大的乔木,又要有低矮的灌木、贴地的草本植物,由此实现AI产品的极大丰富性。


实际上,当下中国的AI产业,正面临资源应用匮乏、工具链使用门槛高、商业落地艰难等诸多挑战。


这样的现实,靠“大力”出不了“奇迹”,需要培育生态、创建社区,通过为开发者提供全方位支持的环境,才能促进AI技术的进步、繁荣与创新。


而“魔乐”,就是一个既聚合了优质AI资源、AI创新,又能够加速商业应用落地的“智算雨林”,也是一个开发者乐园。


在这里,英雄不问出处。


不论开发者是个人、公司还是高校,只要你能推出平台认可、受欢迎的AI应用,社区不但会给算力、给工具、给平台、给服务,甚至助力开发者实现商业变现。


比如,“魔乐”就联合多家伙伴,推出“国产算力模型应用创新计划”,助力国产原生AI模型的孵化。


同时,天翼云启动“天翼云息壤杯”高校AI大赛,希望将国内外AI领域知名院校、头部实验室/课题组引入“魔乐”。


这既能为国家和社会培养AI人才,又促进了国产算力的技术成熟和生态繁荣。


同时,这也预示着未来具有革命性的AI应用,将在国产算力、架构的加持下诞生。


这才是天翼云构建“智算雨林生态”的真正用心。


目前,“魔乐”上已发布5800个模型和145个应用。未来,这个数字必将持续增长,“魔乐”也将成为中国AI产业发展的生态重镇。


在业界,天翼云的行业地位有目共睹。


最近,赛迪顾问发布《2024H1中国智算云服务市场研究报告》显示:



天翼云位居2024H1中国智算云服务市场领导者象限,并荣膺2024H1中国算力互联调度市场第一名,彰显其在智算领域的核心竞争力和领导者地位。


此外,在中国信通院联合沙利文(Frost & Sullivan)发布的《智算云生态影响力矩阵》中,天翼云在技术能力、市场能力和战略布局三大维度全面领先,获评全量领导者,领跑智算云市场。


领导者地位的获得,靠的是天翼云对自主创新的执着。


从云操作系统、底层基础软硬件技术,到上层高阶云能力……天翼云坚持关键核心技术上自主攻关、自主创新,实现了“全栈自主可控”。


“息壤”的升级,更是自主创新的重大成果。


在繁荣中国智算产业的道路上,作为云服务国家队,天翼云不仅是大国算力的主力担当,也是智算服务、泽被百业千行的产业担当;更通过“智算雨林生态”建设,成为AI生态培育、人才培养的责任担当。


显然,一个智能无处不在的时代,正在向我们走来。而天翼云作为中国AI产业发展的重要参与者、推动者、甚至引领者,正为此开拓新领域、注入新动能、贡献新力量。



THE  END

尊敬的读者朋友们,衷心感谢您订阅《华商韬略》,为了便于您及时收到我们的最新推送,敬请星标华商韬略公众号,感谢支持,期待长久伴您同行。

华商韬略出品

主编:毕亚军  责编周怡

美编宋晓昱

本文仅代表作者个人观点,部分图片来自网络、图虫创意、东方IC,未能核实版权归属的,不为商业用途,如有侵犯,敬请作者与我们联系

‍‍

华商韬略旗下公众号,欢迎关注


投稿、约稿、商务合作及建议
敬请联系:010-65580525

zy@hsmrt.com  周总监

◆◆◆

本文系网易新闻•网易号【特色成长计划】
签约账号【华商韬略】原创内容
◆◆◆

点赞”是喜欢,“在看分享”是真爱

华商韬略
聚焦标杆与热点、解构趋势与韬略
 最新文章