似乎从没有一场技术变革如同人工智能(即:AI)一样来势迅猛。
来自ARK投资管理公司的数据显示,2023年到2030年的这7年间,AI对经济累积的影响将是蒸汽机对经济80年累积影响的4.5倍,AI相关的新技术引入后对GDP累积增长的贡献率为130%。AI不仅是技术革命,更是一场经济革命。
在浪潮信息生态合作伙伴大会IPF2024上,浪潮信息董事长彭震表示,以系统为核心的全局创新已成为推动人工智能高速发展的产业新范式。
浪潮信息董事长彭震
值得一提的是,今年是IPF举办的第十年。回顾这十年,人工智能技术从曾经的缓慢酝酿到如今临近爆发奇点,浪潮信息也随着其对计算产业的理解不断深入和迭代。在浪潮信息看来,未来,一切计算皆AI。
透过今年IPF,笔者观察到,未来浪潮信息最重要的变化将来自于其围绕“元脑”品牌的全面升级所展开的一系列布局。元脑既是智算,也是生态。下一个时代,浪潮信息锚点已定。
以系统为中心
从2017年Transformer模型出现至今,芯片性能只提升了8倍,但人工智能计算系统的性能却提升了1000倍。究其原因,正是因为系统创新。不可否认,大模型的突破离不开算力的突破,但面对算法对于算力近乎无穷尽的需求,依靠提高芯片单点性能来提升算力的传统模式已经十分困难。“算力更多来源于系统性的整体创新,而不单单是芯片创新。”彭震直言,“如何发挥系统的价值,提升系统的效率,是人工智能非常重要的创新点。”
单纯“卷”算力、“卷”算法、“卷”数据量并不能高效提升AI效能。在浪潮信息看来,人工智能的突破需要算法、算力和数据协同发展。算力包括了计算、存储和互联,强大的算力为数据提供存储与计算支撑,支撑算法的训练和推理;算法则一方面牵引组织数据,一方面牵引计算架构的改进;数据既为算法供给信息与知识,又能牵引存储架构的优化。它们之间还需要有网络的高速互联。应以系统创新、全局优化,拓展创新路径,通过技术、框架和规范的全方位创新,打造人工智能基础设施。
“一切计算皆AI”意味着,无论个人终端,还是数据中心、边缘,未来所有的计算设备都需要具备AI的能力。在IPF2024上,浪潮信息将计算品牌全面升级为“元脑”,就是要从业务战略、产品创新、生态发展等各个方面,构建以人工智能为核心的业务体系。“人工智能是未来最大的产业的机遇。在这样的判断下,我们认为未来所有的计算都是智算,都是AI,所以,把“元脑”升级为智算品牌。”浪潮信息高级副总裁刘军表示,“原来人工智能只是浪潮信息在某个产品线或某个局部的策略,今天它是整个公司的战略。”
让应用更“贴地”
未来的赛道将由“客户”而非“产品”来定义,说到底,AI应用最终还是要走向百行千业。
众所周知,搭建基础大模型的技术门槛高、开发复杂、成本不菲,成本很高,而且与模型的规模成正比,如果企业能够善用这些模型,将会降低在业务中应用基础模型和生成式AI的难度,释放更多的AI生产力。
为此,浪潮信息重磅推出了企业大模型开发平台EPAI(Enterprise Platform of AI) “元脑企智”,为企业AI大模型落地应用提供高效、易用、安全的端到端开发平台,提供数据准备、模型训练、知识检索、应用框架等系列工具,支持调度多元算力和多模算法,帮助企业高效开发部署生成式AI应用、打造智能生产力。从研发、生产供应链到销售到行政,EPAI能够广泛赋能企业内部的各类应用场景。“我们今天可以站在整个产业和生态的基础上,把我们的工具和方法论来赋能给生态合作伙伴,他们可以通过EPAI平台再去服务他们的行业客户。”刘军表示。
生态层面,浪潮信息发布了EPAI种子计划,以EPAI为核心打造赋能伙伴的生态引擎,通过多种举措全力赋能伙伴商用大模型开发能力,计划在3年内将伙伴数量扩充至1000家。
随着面向不同业务场景算力需求的不同,服务器架构正在由CPU密集型转向搭载GPU、FPGA、ASIC芯片的加速计算密集型,同时,CPU处理器架构也呈现多元化,x86、ARM、Power、MIPS、RISC-V等处理器架构持续并存。多元异构给算力系统设计带来了协议标准不统一、系统功耗、总线速率、电流密度不断提升等多维度的挑战。浪潮信息通过硬件解耦、构建通用软件代码库等,实现了不同架构处理器的优化适配,为用户业务场景打造最适合的算力系统。
在浪潮信息看来,没有最好的算力,只有最合适的算力。浪潮信息服务器产品线总经理赵帅解释道:“评判的标准在于这种架构对用户的价值是什么,以及对产业生态的影响力和拉力是什么,核心是要为用户提供最好的场景,满足客户的业务需求。”
以浪潮信息面向AI大模型训练及推理场景的服务器NF5698G7为例,它可以支持15种基于OAM标准的开放加速芯片,并为用户构建了一个千卡液冷集群,支持超千亿参数量的AI大模型训练。
同时,浪潮信息联合英特尔发布了AI通用服务器,可运行千亿参数大模型,可以在2U空间搭载4颗英特尔处理器,支持AMX(高级矩阵扩展)等AI加速功能,内存带宽1200GB/S,全链路UPI总线互连,传输速率高达16GT/s,可提供430TOPS/INT8、215TFLOPS/BF16智能算力,满足千亿大模型低延时要求。
此外,为实现智算力的多元异构融合,浪潮信息还打造了支持多元算力的服务器操作系统KOS、智算操作系统-智算OS、智能运维系统InManage,通过一系列的软硬件协同优化,将多元算力转变为可调度的资源,一切都是为了让算力好用、易用,更好地推动人工智能产业加速发展。
洞悉技术发展路线和客户业务诉求后,浪潮信息在AI时代抛下了新的锚点。