开源四年 昇思占新增市场30%

文摘   2024-12-19 17:28   北京  

▲关注中国信息化周报

新视界、新思维、新洞察

中国工程院院士何友在创新源动力框架新选择昇思人工智能框架峰会上表示,在AI技术体系中,AI框架处于“承上启下”的位置,南向使能多样化算力,北向孵化各类算法模型,是人工智能应用创新的土壤和源泉。“人工智能产业需要开源开放的共享体系,发挥产学研的集体智慧,加速AI技术的不断创新;更需要高效易用的工具,消除AI技术与行业应用之间的壁垒,加速AI应用走深向实”。

驱动AI模型未来创新

人工智能高速发展,大模型技术加速演进,参数量走向万亿级,序列长度迅速增长,模型结构走向多模态甚至全模态。模型计算过程从单模型单任务走向多模型多任务,深度学习和强化学习相融合,AI框架面临前所未有的挑战与机遇。

面对大模型主导人工智能演进方向的新形势,面向未来的AI框架需要同时具备哪些技术特点和生态构建能力?华为ICT战略与业务发展部总裁彭红华表示,只有同时具备“更高效、更敏捷、更开放”的技术与构建生态能力,才能更快、更简、更稳地助力AI模型开发、训练、推理的全过程。

华为ICT战略与业务发展部总裁彭红华

据彭红华介绍,华为一直坚持打造开放的计算生态体系,面向AI计算领域,通过开放模组、板卡、部件等基础硬件,打造满足专业场景的多样化产品。通过开放基础软件,使能伙伴开发者创新原生AI模型与应用。

昇腾在过去的五年中取得了显著成果。第一,生态伙伴数量获得大幅增长。硬件伙伴从5家发展到60多家,软件伙伴从100多家发展到2000多家,吸引了越来越多的企业加入其生态系统。

第二,产品丰富度提升。基于昇腾开发的硬件产品已经近千款,联合开发的解决方案接近4000多个,广泛应用于多个行业的核心业务场景,这表明昇腾的技术实力得到了市场的认可,满足不同行业和场景的需求。

第三,行业渗透力增强。昇腾的产品和解决方案在互联网、金融、政府、电信、能源、交通、公共事业等行业应用,具有广泛的适用性和强大的市场竞争力。

在2020年3月,华为就开源了昇思MindSpore框架,目前已孵化、支持50多个国内外主流大模型;开源版本已累计获得1100万次下载,覆盖全球130多个国家和地区的2400多个城市;3.7万多名开发者参与社区贡献;昇思与360多所高校科研院所展开教学及科研合作,联合1700多位生态伙伴,打造超过2000多个解决方案;中国科学院科技战略咨询研究院预测,在中国AI框架2024年新增市场中,昇思份额将达30%。

共筑软件根基和开源生态

“未来,昇思将继续探索领域数据生态机制,建立领域高质量数据连接,以‘算法+数据’持续推动模型产业生态蓬勃发展”。彭红华表示,昇思将坚持以开源的方式,向业界开放技术创新成果,携手产业界客户、伙伴和广大开发者在以下三方面共同努力。第一,探索前沿分布式技术,以更高效的AI框架加速模型创新。昇思在设计之初就构筑了框架原生分布式并行能力,最大化实现算法泛化性,以应对快速迭代的模型技术。面向多模态、长序列、MoE(混合专家模型)等主流场景,联合产业界、学术界积极探索,打造业界最全的多维混合分布式并行算法,并提供业界首创的并行策略自动配置能力,将万亿MoE训练效率提升50%以上。OpenAIo1(OpenAI发布的推理模型系列)开辟的模型新范式对分布式能力带来新诉求,需要连接多模型多任务,加速模型自我博弈,实现逻辑能力涌现。昇思在框架层面创新多模型多任务引擎,探索多模型混合编程及并行技术,为类o1模型创新提供基础框架能力支撑。

第二,强化全流程开发部署能力,以更敏捷的AI框架加速应用落地。昇思聚焦生成式AI的快速开发和端侧部署,持续演进套件化开发及部署能力,6小时即可复现LLaMA3.1-7B模型,天级即可完成典型大语言模型部署;在LLM+强化学习(大语言模型与强化学习相结合技术)的模型技术演进趋势下,昇思创新训推同构架构,强化大模型从训练到推理的快交互能力,打造开发套件,加速强化学习类大模型的推理与应用部署。

第三,激发开源智慧共促产业发展,以更开放的AI框架共建繁荣生态。昇思以技术为源赋能开发者,以众智计划、联合创新建立技术与科研连接,孵化科研成果。积极建立上游社区连接,与中国人工智能学会、鹏城实验室联合发布昇思MindSpore学术基金,预计3年内携手50多位全球AI学者,攀登学术新高峰。开发者是推动昇思社区发展的中坚力量。昇思MindSpore开源社区理事长丁诚表示,昇思将提供分层分级的学习与发展体系,通过学习、实践、专项学术论文基金、社区项目支持等方式,发展开发者、鼓励技术创新、激励成果落地;在开发者回馈社区、贡献社区、共建社区的过程中,与开发者共成长。第一,在开发者编程体验方面,昇思兼容业界主流生态,持续降低迁移学习成本;第二,在大模型训练方面,昇思提供更丰富的分布式并行策略,结合自动搜索仿真调优,为大模型训练节约端到端成本;第三,面向最新类o1模型带来的技术挑战,完善多模型多任务调度、训推无缝转换能力。


作者:杨光
编辑:高珊珊
监制:刘晶

—End—



注:转载、添加白名单以及商务合作请在公众号后台留言,未经许可、不得转载,不得随意修改及盗用原文。

中国信息化周报
《中国信息化周报》与中国信息主管网联动,围绕政府、制造、金融、医疗、教育等行业内容,面向信息化建设领域,报道信息化建设中的新需求、新应用、新体验,为各级工业和信息化主管部门的决策者、企事业单位信息化建设的管理者提供全方位、多元化服务。
 最新文章