内有大模型厂商竞相涌入C端市场,外有美国就“芯片之争”对中国实施技术封锁。在这样的局势下,华为云盘古大模型毅然选择了一条难而正确的实干道路:全栈自主研发,破解算力难题,并通过AI重塑千行百业,带来实际的商业化价值。正如盘古开天辟地般,盘古大模型以其实干精神,为各行各业注入崭新的生产力。
2024年上半年,在英伟达发布的Form 10-K年度报告中,华为被列为英伟达在AI芯片等多个领域的主要竞争对手,意味着英伟达首次公开承认了华为在AI芯片技术领域的卓越实力。这不仅映射出全球科技版图的动态变迁与激烈竞争态势,同时也预示着,在全球科技竞技场上,华为已成为一股不容小觑的力量,引领着行业发展的新浪潮。
作为全球领先的ICT(信息与通信技术)解决方案提供商,华为自1987年成立以来就具备了务实、理性的企业基因。三十多年来,华为始终秉持“以客户为中心,以奋斗者为本”的核心价值观,不断推动技术创新,致力于用科技改变世界。面对全球科技格局的深刻变革,尤其是中美科技对抗的复杂背景下,华为更是展现出了坚韧不拔的精神,通过自主研发和持续创新,突破技术封锁,巩固其在全球市场的地位。
在人工智能以大模型为突破点革新的当下,华为意识到,掌握核心技术、构建自主可控的AI大模型,并将其深度融入千行百业,推动产业智能化升级,对于企业乃至国家都有着巨大的意义。基于此,华为投入了大量资源与技术力量,历经数年研发,成功推出了华为云盘古大模型。这一模型的诞生,不仅是华为在AI领域的一次重大突破,更是其在中美科技对抗中,坚持自主创新、走难而正确之路的生动写照。通过盘古大模型,华为正逐步构建起一个开放、协同、共赢的AI生态体系,为千行百业的智能化转型注入强劲动力。
1
战略定位:AI for Industries
当C端明星产品以惊人的交互能力席卷市场,赢得万众瞩目之时,各界却对AI大模型提出了关于“新质生产力”的新期许。华为云盘古大模型坚持选择了一条难而正确的实干道路,B端领域悄然孕育着另一场更为深邃的变革。
坚持正确的实干道路
当前,人工智能领域的革新正以大模型为新增量,显著体现在一系列贴近用户层面的明星级C端产品频繁涌现。然而,人工智能在制造业等B端领域的应用潜力似乎尚未得到充分挖掘,其前景极为广阔且不可小觑。不止步于会“作诗”,更应当会“做事”,各界对于人工智能的期待已不仅仅局限于“聊天、作图”这些C端基础功能,而是更加看重其在实际生产中的“实干”能力。
华为大模型产业化的初衷,便在于开辟更多B端业务场景,华为多位高管对此均有明确表态。华为云人工智能领域首席科学家田奇多次强调,AI for Industries是人工智能新的爆发点,大模型是连接技术生态和商业生态的桥梁,是未来AI生态的核心。华为常务董事、华为云CEO张平安在发布盘古大模型3.0时,更是明确指出:“华为做AI的方向始终是AI for Industries。”他直言,“盘古大模型没有时间作诗和聊天。参数再多、对话能力做得再好,但如果解决不了实际问题,也没有多大用处。”这一系列表态,不仅体现了华为对AI技术发展趋势的深刻洞察,更彰显了其在行业应用中的坚定决心。
华为认为AI for Industries将是新爆发点
解AI产业化最难的题
AI for Industries的道路并非坦途。华为云盘古大模型道路之“难”,体现在技术挑战、国际竞争以及行业智能化转型的多重压力。
首先,在技术层面,不同行业应用场景的复杂性、数据稀缺性以及模型泛化能力的需求,都对AI模型的算法精度、训练效率和适应性提出了极高的要求。特别是在某些特定行业中,数据获取难度大,开发成本高,且要求模型具备高度的灵活性和适应性。
其次,国外AI企业在技术和市场占有率上的先发优势,也给起步较晚的华为云盘古大模型带来了不小的竞争压力。谷歌云平台(GCP)、亚马逊网络服务(AWS)和微软(Azure)作为全球三大云服务提供商,共同占据了市场的较大份额。相比之下,华为云盘古大模型在全球市场上的知名度和用户基础相对较小。如何在竞争激烈的市场中脱颖而出,成为华为云必须面对的重要课题。
此外,不同行业的智能化转型需求差异显著,需要AI模型具备高度的定制化能力。而行业要想实现智能化转型,涉及技术、人才、管理等多个方面的重组革新。华为云盘古大模型在推动AI产业化落地的进程中,各行各业智能化转型的困难在所难免。
2
技术底座:
昇腾AI芯片,国产算力的底气
在全球科技版图的激烈争夺中,人工智能已成为各国竞相追逐的战略高地。然而,当国际贸易的风云突变,特别是针对关键技术领域的限制措施加剧,中国AI产业面临着前所未有的挑战。在这样的背景下,华为昇腾AI芯片的诞生与崛起,成为了中国科技自立自强的生动写照。
逆境中的曙光:昇腾的诞生背景
时间回溯到几年前,当国际巨头在AI芯片领域占据绝对优势时,中国企业大多处于追赶者的位置。面对外部环境的严峻考验,特别是英伟达等公司在全球范围内对高端GPU供应的收紧,中国AI产业感受到了前所未有的压力。国内算力捉襟见肘,普通用户尚能感知到C端产品在高峰时段的等待和卡顿,大企业用户的算力需求更加难以满足。在这样的情况下,华为用昇腾AI芯片项目给出了他们的解决方案,成为了国内AI破局的关键。
立项之初,昇腾也收到了一些不被看好的声音。一方面,国际竞争已经白热化,中国企业在高端AI芯片领域缺乏经验和技术积累;另一方面,内部也面临着诸多挑战,如研发投入巨大、技术路线选择困难等。然而,华为人凭借着一股不服输的劲头,毅然决然地踏上了这条充满未知与挑战的道路。
从默默无闻到一鸣惊人:昇腾的崛起历程
2018年,在第三届华为全联接大会上,华为轮值董事长徐直军首次公开了华为的AI战略,并首次公布了昇腾910和昇腾310两款AI芯片。这一消息如同一石激起千层浪,在业界引起了巨大轰动。然而,此时的昇腾还只是一个初出茅庐的新秀,需要正式面世并经过实战的考验,才能证明自己的实力。
在接下来的几年里,昇腾团队夜以继日地攻克技术难关,优化产品性能。终于,在2019年,华为发布了算力最强的AI处理器“昇腾910”,并推出了全场景AI计算框架MindSpore。华为公司轮值董事长徐直军在发布会上表示:昇腾910、MindSpore的推出,标志着华为已完成全栈全场景AI解决方案的构建,也标志着华为AI战略的执行进入了新阶段。这一刻,昇腾完成了从默默无闻到一鸣惊人的华丽转身。
与此同时,在国际大舞台上,诸如Google、Meta、微软、亚马逊、特斯拉等科技巨头,正利用超万卡集群推动其在基座大模型、智能算法研发,以及生态服务等方面的技术创新。
作为国内科技企业的代表,华为也不断追赶国际趋势,在超万卡集群的建设和使用过程中不断推动技术革新。在2023年昇腾人工智能产业高峰论坛上,华为宣布昇腾AI集群全面升级。集群规模从最初的4000卡集群扩展至16000卡,成为业界首个万卡AI集群,拥有更快的训练速度和30天以上的稳定训练周期,比业界其他方案领先十倍。可以说,昇腾AI集群的此次升级,为破解国内AI“算力荒”问题提供了坚实保障。
华为昇腾发展时间线
昇腾的市场布局与战略意义
目前,昇腾围绕其计算体系,在能源、金融、公共、交通、电信、制造、教育等多行业实现应用,服务600多家企业客户,提供城市智能中枢、昇腾智巡、昇腾智行、昇腾制造等解决方案。根据《财经杂志》报道,粗略估算,昇腾目前在国产AI芯片市场占据了60%以上的份额。
以昇腾为基础,配合华为云 CloudLake 和 CloudPond 边缘云平台,构建起云-网-边端协同的Alnative 算力平台,昇腾的战略意义不仅在于填补了中国在高端AI芯片领域的空白,更在于为中国AI产业的自主可控提供了坚实的支撑。在AI技术博弈日益激烈的今天,昇腾体系的存在为中国AI生态构筑了一道坚固的防线,赢得了宝贵的战略空间。
3
盘古大模型:
全栈自主,让技术创造价值
有了昇腾AI芯片的强大算力支持,华为通过打造盘古大模型来调动算力,让AI真正解难题、做难事,重塑千行万业。
自2020年立项以来,盘古大模型便致力于将AI技术深度融入行业应用中。从2021年的预训练大模型首次发布,到2023年的全栈自主3.0版本,再到最新的5.0版本,盘古大模型不断迭代升级,为不同行业提供了多样化的解决方案。
架构先行,灵活应对行业需求
盘古大模型之所以能够迅速融入各行各业,得益于其开放的架构和强大的工程化套件。华为中国政企业务副总裁郭振兴曾明确表示:“大模型从研发设计到落地应用,第一步应该是架构先行,建立分层解耦的统一云化平台。”盘古大模型正是采用了这种分层解耦的设计思想,其“5+N+X”三层架构是其应对行业复杂需求的关键所在,包括L0基础大模型、L1行业通用大模型和L2场景模型三个层次。L0层的5个基础大模型提供了满足行业场景的多种技能;L1层的N个行业大模型则根据不同行业的具体需求进行微调;L2层则专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。这种分层解耦的架构使得盘古大模型能够灵活适配不同行业的多变需求,实现快速的落地应用。
盘古大模型架构
基于这种天然具备良好生态开放性的分层解耦架构,盘古大模型为客户提供调用集成和定制联创两种应用模式,可以快速适配,满足多种场景业务诉求。在调用集成模式下,L0基础大模型提供了100多个能力集,企业可以根据自身需求,通过API直接调用,快速开发行业场景应用;而在定制联创模式下,企业则可以在L0或L1盘古大模型的基础上,通过对自有数据的二次训练,快速构建出专属的行业大模型。这种灵活的应用模式,极大地降低了企业使用AI技术的门槛和成本。
同时,华为云盘古大模型还提供了工程化套件,简化了大模型的开发流程,能够帮助企业用户快速构建大模型原生应用。据田奇介绍,基于华为云盘古大模型工程化套件,完成一个千亿行业模型端到端的开发时间从过去的5个月缩短到了现在的1个月,整体速度提升了5倍。
应用优先,以产业价值驱动研发
华为人工智能首席科学家田奇曾表示:“华为大模型产业化的初衷在于开辟更多B端业务场景,并将工业化的一面放置在更高的优先级上。”正是基于这一理念,盘古大模型在立项初期,研发团队便前瞻性地携手众多合作伙伴,开展了一系列详尽的产业化和商业化验证,确保其能够真正走入真实产业场景中并发挥价值。这恰恰是盘古大模型区别于其他项目的独特之处——将赋能工业生产、促进商业化应用作为研发的核心导向,以产业价值来驱动研发创新。
在选择落地行业方面,华为中国政企业务副总裁郭振兴提出应用场景的“先易后难、缓进急战”。从高频、刚需、价值大的场景率先入手,快速实现价值闭环,然后再逐步向更难的场景深入,形成正循环的飞轮效应。
迭代升级,进入盘古5.0时代
2024年6月22日,华为云盘古大模型迎来了新的里程碑——盘古大模型5.0。这一版本的发布,不仅标志着盘古大模型在技术上的又一次飞跃,也预示着其在行业应用中的无限可能。
盘古大模型5.0在全系列、多模态、强思维三个方面进行了全面升级。首先,它提供了小中大超大杯四种不同参数规格,满足客户多样化的需求。其次,在多模态能力上,盘古5.0能够精准地理解物理世界中的文本、图片、视频等多种模态信息,并生成更符合物理规律的多模态内容。这种能力将直接应用到工业制造、自动驾驶、建筑等价值场景中,推动行业的智能化升级。在思维链方面,盘古5.0将思维链技术与策略搜索深度结合,极大地提升了数学能力、复杂任务规划能力以及工具调用能力。这使得智能体能够在复杂环境中进行有效的学习和决策,是大模型成为行业助手最关键的特征。
华为诺亚方舟实验室主任姚骏介绍盘古5.0关键创新
4
重塑千行百业,深入国计民生
技术创新之外,盘古大模型还是一个天然瞄准AI工业化、现实场景的项目。走出实验室,到真实产业场景进行广泛应用,华为云盘古大模型成功跨越了技术与应用之间的鸿沟,为千行百业带来了前所未有的变革与升级。
2023年以来,盘古大模型持续深耕行业,已在30多个行业、400多个场景中落地,展现出强大的应用潜力和实际成效,深刻影响着煤炭开采、钢铁制造、气象预测、高铁运营这些关乎国家命脉和民众生活的传统行业。
盘古大模型行业全景图
让煤矿开采更加安全可持续
在煤矿开采行业中,长期面临安全隐患监管困难的痛点。传统的人工管理方式不仅耗时费力,还容易引发安全事故。然而,随着华为云盘古大模型的引入,这些难题正逐步得到破解。
盘古大模型通过与矿山业务应用的深度融合,利用小样本快速训练出精准的场景化模型,如顶板支护作业监测、锚固剂用量与搅拌时间识别等,有效解决了煤矿施工中隐蔽工程难以监管的难题。这些智能模型能够实时捕捉作业现场的关键数据,并通过视觉识别+AI技术分析,实现对作业行为的精准规范,大大降低了因人为疏忽导致的安全风险。同时,结合智能监控和预警系统,盘古大模型还能实时监测矿井环境,确保生产作业的安全进行。据悉,盘古矿山大模型已在山东能源集团30多家煤矿进行推广应用,涵盖采煤、掘进、主运等9个专业领域,并孵化了49个细分场景的智能应用。
让钢铁生产提效增收
钢铁工业作为基础原材料行业,生产流程复杂,尤其是一些尖端钢铁材料十分依赖一线操作工人日积月累的经验判断。在钢铁生产的流水线上,更换钢板规格往往需要投入大量的人力与时间,而盘古大模型的引入,则大幅度缩短了这一调优过程所需的时间。
以上海宝武钢铁公司的热轧生产线为例,每当需要变更生产钢板的类型或尺寸时,工程师需重新校准7组精密轧机的300余项参数,这一过程通常需要大约5天的时间。盘古大模型能够对最优参数进行预测,将热轧生产线调优时间缩短到短短几个小时,并提高预测精度和钢板成材率。目前盘古大模型已在宝钢1880热轧生产线上成功运行,实现了超过5%的预测精度提升和0.5%的钢板成材率增长,预计年度可增产钢板超过2万吨,带来超过9000万元的年收益。此外,盘古大模型还将应用于高炉场景,对炉温、铁水温度、硅含量等炉况进行仿真,以助力高炉实现精确控制,确保能源的最大化利用,降低能源成本。
重塑气象预报模型的未来
气象过程过去被认为是无法完全观测,过程机理也都不甚明确的一个领域。以往虽然有AI气象预测,但其精度显著低于传统的数值预报方法。华为云盘古大模型研发团队发现,AI气象模型的精度不足主要原因在于2D神经网络无法很好地处理不均匀的3D气象数据。
为此,团队创造性地提出了适应地球坐标系统的三维神经网络(3D Earth-Specific Transformer)来处理复杂的不均匀3D气象数据。华为云盘古气象大模型发布后,成为全球首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速10000倍以上。目前,盘古气象大模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景,为政府决策、农业生产、公众出行等提供有力支持。2023年,国际顶级学术期刊《Nature》杂志正刊发表了华为云盘古大模型研发团队的气象研究成果,并给出了“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展”的高度评价。
让高铁巡检更加省力且准确
在高铁巡检方面,面对全国每天高达3.2万节车厢的庞大检测需求,传统的人工巡检方式不仅耗时耗力,且难以保证检测的全面性和准确性。然而,随着盘古大模型与巡检机器人的深度融合应用,这一难题得到了根本性解决。
如今结合盘古大模型和巡检机器人,可精准识别一列动车的3.2万个项点,覆盖8大类、350多种复杂故障。这一突破性进展,将许多巡检工人从繁重的劳动中解放了出来,减轻、减少凌晨时段巡检的艰辛作业,同时也大幅提升了检测效率和检测准确率。据统计,一个大模型就能覆盖8大类型、350多种故障,而且故障识别率已经提高到了99%以上,为高铁的安全运行提供了更为坚实的保障。
5
结语:走难而实干的路
在科技领域,没有捷径可走,唯有脚踏实地、自主研发,才能赢得未来的主动权。华为云盘古大模型的诞生,是我国AI产业在自立自强道路上的一次重要飞跃。面对全球科技竞争角逐的激流与暗礁,华为秉持着坚定的信念,勇啃AI全栈自主研发与产业化应用的两块“硬骨头”,不仅实现了核心技术的自主可控,更为千行百业的数字化转型提供了强有力的支撑。这条难而实干的道路,彰显了华为对国家科技安全与经济发展的深切责任感。
另一方面,我们也应看到,大模型的发展并非一帆风顺。尤其是在当前全球科技格局深刻变革的背景下,一些西方国家在科技领域的霸权主义和单边主义行径,给我国AI大模型的发展带来了不小的挑战。此外,AI技术最终要服务于行业的变革之中。但推动行业智能化转型之路,可谓水深浪大。应用成本的高昂、各行业技术需求的复杂多样性,以及数据安全等诸多方面的问题,共同构成了这条道路上的重重难关。未来,华为云盘古大模型的行业化之路,依然可谓任重而道远。
更多深度好文
点击下方文章标题,立即阅读最新行业热点、业界趋势
购买最新杂志
长按下方卡片识别二维码,购买最新杂志
关于我们
本文编辑:王佳梁
本微信号由中国传媒大学广告学院《媒介》杂志独家运营
版权所有,违者必究
点击下方卡片,关注公众号,第一时间获得最新深度资讯