编辑:阿冒
设计:沐由
清晨无风浪自涌,中流歌啸倚半酣。
2024年欧洲杯小组赛渐入佳境的同时,一场全球开发者瞩目的大型盛会——华为开发者大会(HDC 2024),在广东东莞松山湖如约而至,“我们相约老地方”。
在被数字技术改写和塑造的新世界里,舞台属于开发者。
从6月21日到23日,一系列丰富多样的主题演讲、峰会、专题论坛、互动体验,以及数百场面向开发者的特色活动,成为松山湖最绚丽的风景线,从而勾勒出更为清晰的技术图谱。
作为一名从2019年起就参与到首届华为开发者大会的媒体人,我的感受和往昔尤其不同,甚至于出发前在西安咸阳国际机场,我就邂逅了几位同赴本次大会的年轻开发者。
从他们坚定与期待的眼神中,我读到的是:
其时已至,其势已成。共襄盛举,擘画未来。
盘古大模型5.0的三大升级
最近两年里,科技领域最火的无疑是大模型,我们甚至不用加上“之一”的注解。资本的青眼有加,资源的海量注入……大模型的参数规模已经轻松突破了万亿级别,并且仍在增长中。
华为云盘古大模型,正是其中的典型代表。立项于2019年、发布于2021年的华为云盘古大模型,不仅起步早,而且深度集成了华为云在AI领域的诸多研究成果,在短短几年里就实现了快速的迭代与演进,成为当前国内行业大模型应用的主力军。
在本次大会上,华为常务董事、华为云CEO张平安隆重发布了盘古大模型5.0。他表示,盘古大模型5.0实现了多模态、全系列、强思维的三大创新升级。
多模态:与此前相比,盘古大模型5.0能够更加精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。在内容生成方面,采用业界首创的STCG(可控时空生成)技术,可生成更加符合物理规律的多模态内容,能实现对更为广泛和复杂应用场景的输出与赋能。
全系列:盘古大模型5.0包含不同参数规格的模型,就像是齐天大圣的那根如意金箍棒一样可大可小:有十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;有百亿级参数的Pangu P系列,适用于低时延、高效率的推理场景;也有千亿级参数的Pangu U系列适用于处理复杂任务;还有万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。
强思维:华为云将思维链技术与策略搜索深度结合,极大提升了盘古大模型5.0的数学能力、复杂任务规划能力,以及工具调用能力。多管齐下的举措,带来的是智能体能够在复杂环境中进行有效的学习和决策,这种复杂逻辑推理也正是大模型成为行业助手的关键。
本次大会上,搭载了华为云盘古具身智能大模型的乐聚人形机器人——夸父也正式亮相。夸父可以实现多场景泛化和多任务处理能力,能够对复杂场景进行学习,一系列识别物体、问答互动、击掌、递水的精彩演示,将现场的气氛不断推向高潮,也引得台下彩声连连。
从发布的第一天起,华为云盘古大模型的指向就是“为行业而生,更好地服务于千行万业的客户”。张平安表示,盘古大模型不仅要做难事,更要帮助客户解难题,让每个行业、每家企业、每个人的工作更加高效和轻松。
据张平安分享,华为云盘古大模型在过去一年里在三十多个行业、四百多个场景中落地,在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥着巨大价值。
推动行业大模型的走深向实
从工业革命到现代社会,钢铁一直是推动世界发展的基石。从布莱顿炉的发明,到贝塞麦转炉和基氧炉的诞生,钢铁行业效率不断提升,为人类社会的进步与发展做出了卓越的贡献。
宝武钢铁是全球规模最大、最具影响力的钢铁企业,2020年钢产量就突破了1亿吨,被认为是未来最具发展潜力的钢铁企业之一。
今天的钢铁行业,正在见证一个前所未有的重大转型时刻。然而,产能过剩和全球化挑战使得企业必须寻找新的生存与发展之道,因此充分应用人工智能,实现向高技术、低碳环保的转变就变得势在必行。
2023年,宝武钢铁与华为公司达成了数字化转型等议题的合作意向,在2024年开始全面推进AI战略转型,稳步布局“钢铁+AI”的场景应用,开展钢铁领域大模型的建设。
据张平安介绍,华为云盘古大模型等方案主要应用在高炉炼铁和热轧钢——这也是钢铁制造的核心环节。双方的团队就大模型在以上环节的应用,梳理出多个场景加以有效优化与稳步提升。仅以高炉为例,盘古大模型的优化预计每年就可以为宝武钢铁降本超过10亿元。
再来说说高铁。有些人可能会感到奇怪,高铁已经成为我国的靓丽名片,出行舒适、便捷直达,欧美宾客也不得不为之点赞,难道国人为之骄傲的高铁也有难以言说之痛?
事实上,正是如此。
很多人不知道,一列16节车厢编组的动车居然拥有多达3.2万个故障检测项点,覆盖了8大类型、350多种故障,如果采用传统故障识别方式,其人力物力的消耗巨大,而且效率低下。
华为云盘古铁路大模型对大量图像的预训练,以及对数百万张高铁图片的学习,使得它可以快速适配高铁所有场景,开箱精调准确率即可达到90%以上,高于行业平均水平10个百分点。通过数据反哺,边用边学,使得故障识别准确率进一步提高到99%以上。
通过将盘古大模型应用于高铁巡检机器人,北铁所实现了动车检测的智能化落地,将巡检工人从繁重的劳动中解放出来,还大幅提升了检测效率和检测准确率,更进一步保障了高铁的安全运行。
在气象预报、自动驾驶、工业设计、建筑设计、媒体内容生产等更多领域,华为云盘古大模型也不断落地,推动着行业大模型的走深向实。
以全栈AI创新重塑千行万业
纵观近年来华为云在AI领域的整体策略,我们不难梳理出其背后的战略思考与业务逻辑,即不断以实际和典型的应用落地为导向,通过精炼的产品方案将AI技术导入到企业的主业务流程和主生产流程之中,从而让AI能够最大程度地释放出生产力。
华为云Stack大模型混合云,就是这种思路的典型代表之一。
在本次大会期间的“大模型混合云,十大创新技术引领政企智能升级”高峰论坛上,华为云还重磅发布了大模型混合云十大创新技术,彻底打通大模型应用落地过程中关键堵点,解决大模型行业应用的“最后一公里”。
针对当前大模型行业应用的各种难题,华为云通过AI-Native存储、增强AI网络、算子加速、多样性算力调度、云边协同、数据工程、统一数据编码、精细视觉神经网络、无感断点续训、安全护栏等方面的拓进,帮助企业更高效、更便捷地训练和使用大模型等AI技术,以系统性创新加速行业智能化的升级。
毫无疑问,华为云已经打造出一个全新的技术生态,为中国乃至全球的应用开发者、创新者提供了核心技术支撑。通过全球存算网、昇腾AI云服务、盘古大模型等创新技术,由上及下、由外及里的全栈AI能力,为千行万业提供了全栈AI创新的稳固平台。
我们知道,大模型的“好坏”,在很大程度取决于GPU加速卡的算力。目前,国内市场上GPU已经极度短缺,而且已经涨价超过40%,随时断货乃至限制的阴影,时不时笼罩在创业者和创新者的头顶之上。
华为云2023年发布的昇腾AI云服务,能为大模型训练推理提供澎湃算力。一年以来,华为云对昇腾AI云服务进行持续优化,针对业界万亿参数模型训练的平均无中断时长,昇腾AI云服务可实现40天无中断,远优于业界的2.8天;针对业界平均集群故障恢复时间约60分钟,昇腾AI云服务可以缩短到10分钟,同时能将大模型的资源开通时间从月级缩短到天级,加速大模型的开发。
华为云昇腾AI服务,不仅10倍提升大模型训练和推理效率。更关键的是客户无需花费几个月自建,一键即可接入相应的AI算力节点,高效率低成本地实现数百PB数据、万亿级参数的大模型训练。
华为云全栈的技术能力,使得从云化算力、模型开发、模型托管到生态的全栈服务成为可能,行业客户更可以借助套件和开发工具,对大模型进行调优、迁移等工作;华为云的专业服务支持,也让客户无需担心运维和安全等问题,专心于业务创新。
与此同时,华为云打造百模千态的黑土地,为开发者和创新者提供了开放兼容的环境,行业用户不会被绑定锁死,他们可以根据自己的业务诉求,自由地选择多达100+个开源大模型,与更多的生态伙伴进行全栈能力联合创新,共赢商业新时代。
“一直以来,华为云盘古大模型不断攻坚克难、砥砺前行,重塑千行万业。华为云将与所有的客户、伙伴和开发者一起,创新不止,攀登不止,让云无处不在,让智能无所不及,加速千行万业的智能升级。”张平安强调。
(个人观点,仅供参考)