AI大模型落地,为什么是央国企先行?

文摘   2024-11-13 08:03   北京  

产业互联网第一媒体。 产业家


从2024年1-7月,央国企采购大模型项目数量已超过950个,且均匀布局在智算中心、大模型预训练、Agent和行业应用等多个方向。而除了政策影响,央国企纷纷落地大模型的背后还有哪些推动因素?


作者|思杭
编辑|皮爷
出品|产业家


最高191亿元,最低不到1万元。大模型狂飙两年,国内“AGI阵队”已然形成。同步进行着的,还有央国企的大模型项目建设。


8月6日,神州数码集团发布公告表示,子公司神州鲲泰中标《中国移动2024年至2025年新型智算中心采购(标包1)》,投标报价约191亿元,中标份额10.53%。2024年7月,湖南省委党校湖南行政学院发布招标信息,采购数字机器人服务,报价9000元。



一个是智算中心采购,一个是数字机器人服务;可以看到的是,如今在央国企内部,大模型项目建设已行至中途。甚至毫不夸张地说,在大模型浪潮席卷而来的今天,央国企正在成为一股先行力量,推动着国内大部分的AI大模型落地项目。


据不完全统计,从2024年1-7月,央国企采购大模型项目数量已超过950个,且均匀布局在智算中心、大模型预训练、Agent和行业应用等多个方向。



大模型纷纷落地国央企,阵势如此浩荡的背后,政策推动成为决定性因素。据沙丘智库,自2023年以来,国资委多次对中央企业发展人工智能提出要求。其中,在2024年2月的中央企业人工智能专题推进会上,提出中央企业要“开展AI+专项行动”。会上就有10家央企签署倡议书,表示将主动向社会开放人工智能应用场景。


同年7月,国新办举行“推动高质量发展”系列主题新闻发布会,提出未来五年,中央企业预计安排大规模设备更新改造总投资超3万亿元,更新部署一批高技术、高效率、高可靠性的先进设备。


政策的推动,当然是其中不可忽视的因素。但除了政策影响,站在产业数字化和数智化的潮头,央国企纷纷落地大模型的背后还有哪些推动因素?一个更值得思考的问题是,和云计算时代金融行业成为先锋官不同的是,在如今的AI大模型时代,为什么央国企会成为先行力量?


运营商、政务、能源抢先建设智算中心


AI大模型史上最大项目,当属“智算中心”。


预训练成本的疯狂上涨和推理需求的不断攀升,都在让智算中心成为必要。近日,OpenAI CEO Sam Altman在接受采访时表示,“OpenAI在年内不会发布ChatGPT-5,目前公司专注于ChatGPT-o1的研发和运营。”


GPT-5为什么不发了?原本预计推迟发布的o1又为什么提前登场?这背后的原因不由得引人深思,而训练成本就是这其中的关键因素之一。


言归正传,国内对大模型的预训练需求也愈加迫切。在加速构建国内AGI梯队的同时,性能不断刷新的大模型需要大规模智算集群的支撑。如今,万卡集群已然成为大模型军备赛的标配。而除了国内AI企业和电信运营商,正在推动落地的央国企也在加速构建智算集群,以提高AI大模型的训练及推理效率。


通常来讲,智算中心是由地方政府或电信运营商主导建设。据中国信通院不完全统计,截止2024年7月底,纳入监测的智算中心(含已建和在建)已达87个。


2023年10月,沈阳智能计算中心新基建项目工程总承包(EPC)成交结果出炉,百度携手中国建筑第八工程局有限公司(中建八局)成功中标,中标金额为9.1亿元。具体包括机房建设、机柜设计、智算中心平台,以及百度为其提供的AI软硬件能力的综合性解决方案。


而像这样的智算中心采购项目,央国企已经开始了铺天盖地的建设。对此,产业家根据金额大小,列举了近两年央国企采购智算中心项目金额最高的10个。



对比云计算时代,传统数据中心的中标方大多都是IDC厂商;而在如今的AI时代,则多了不少AI企业和互联网厂商的身影。


另外,从行业分布来看,政务和运营商对智算中心的出资则更加大手笔。对此,产业家统计了运营商、能源和政务三大领域中智算中心项目的占比:结果显示,政务行业对智算中心的投入更大,其中包括GPU租赁、硬件以及算力调度平台的采购。



实际上,从智算中心投入比就可以看出央国企对AI大模型的需求。


可以看到的是,自2023年三季度,央国企就已经开始紧锣密鼓地筹备智算中心建设。而智算中心只是央国企落地AI的一个起点。


一方面,这与上文提到的政策时间点正好吻合;另一方面,2023年第三季度也恰好是以百度、阿里、华为和电信运营商为首的“国内AGI梯队”刚刚形成。


除了智算中心,央国企对AI大模型建设的另一个重点则是行业应用,即针对特定场景搭建大模型平台或应用。


以电信运营商为例,据不完全统计,从2023年至今,运营商对AI大模型的项目建设达到了238起,其中除了75起智算中心建设外,剩余都围绕特定的场景构建大模型,主要有智能客服、营销和数字人方面的采购。


不同行业对于AI大模型的需求不同,项目重点自然也不一样。对于政务和运营商行业而言,之所以智算中心占比更大,除了政策推动,更重要的原因是对于私有化部署、本地部署的需求极高,尤其是政务领域;另一方面,相对于其他行业针对单点或各别环节的大模型应用开发,政务和运营商对大模型的需求则更为系统化,更需要从GPU资源到算力调度平台来发挥作用。


相比之下,在应用AI大模型最多的三个行业中,能源领域对智算中心的投入较少,而更多围绕大模型训练和开发方面,尤其是针对特殊场景如何训练并优化算法,如何微调模型等等。



另外,值得注意的是,对于这些对行业know-how要求更高的领域而言,他们选择中标方的时候也更为讲究;比如在挑选算力调度平台和大模型预训练、开发阶段时,中标方则围绕以百度、科大讯飞为首的AI企业;而在选择在大模型开发过程中,需要特定技术研究时,则会选择南方电网这类更懂know-how的企业。


最后,不同于云计算时代,金融行业成为头部落地试验田;在如今的AI大模型时代,在央国企当中,有四大行业脱颖而出,分别是教育、能源、运营商、政务;而金融行业却并没有表现出像云计算时代那么强的意愿。


AI大模型:颠覆传统IT架构背后


时代变迁。


在过去的云计算时代,大型企业进行数字化转型需要从购买或租赁服务器,到选址建数据中心,再到选择合适的云架构,接下来到平台开发环节及上层应用的搭建。


通常来讲,一家大型企业,如能源或工业企业来说,面对分布在各环节的数据,通常需要建底层的PaaS平台,从而实现灵活调用、互联互通;但尽管如此,数据孤岛、数据烟囱依然存在。


然而,这种从IaaS到PaaS再到SaaS的架构,在如今的AI大模型时代已经彻底被颠覆。企业往往需要一个行业大模型即可搞定,而不再会为了构建多个复杂应用,费时搭建PaaS平台。


诚然,企业在云计算时代交得学费也并没有浪费,在AI大模型时代,央国企在政策引导、需求迫使和环境因素等多方作用下已经开始先行落地AI大模型。


而在这其中,很大一部分都是基于过去云计算时代一些无法解决的顽疾,希望在AI大模型这里找到更好的解法。


可以观察到一个现象,目前央国企在大模型落地方面,主要围绕两点,一个是智算中心,一个是行业应用。后者包括大模型预训练,大模型开发,以及针对各别环节或特定场景构建大模型应用或解决方案。


通常来说,后者通过大模型基于特定场景的解决方案,都是在过去云计算时代无法实现的。


以运营商为例,虽然智能客服已经存在很多年,准确地说,自云计算时代以来,各类智能客服软件和解决方案层出不穷,然而对于整个行业来讲,转人工率依旧居高不下,普遍都在80%以上。而当时代的列车刚刚驶入大模型时代,智能客服就成了大模型落地的第一块试验田。



再比如在能源行业,知识如何沉淀,再如何让新人用起来,一直都是一大难题。即使在云计算时代,工业互联网平台林立,很多问题依旧没有答案。而在如今的大模型时代,一个行业大模型便可以解决很多问题。这其中关键发挥作用的便是在行业大模型构建过程中的RAG搭建环节,它相当于一个企业知识库,任何输入的知识,都可以轻松调用。



像上述所展示的,对于某些行业来说,大模型并不是“鸡肋”。相反,它能够扮演“超强大脑”的角色,将企业的全部智慧汇聚到一起,并有的放矢地发挥作用。


然而,对有些行业而言,大模型目前还并未找到用武之地。


比如在金融行业,目前落地较多的项目主要围绕知识库问答方面,很难深入到核心业务。一方面,是出于金融监管和数据隐私等顾虑;另一方面,也是更重要的,目前AI幻觉问题还很难彻底得到解决,任何AI算法可能为金融行业所带来的错误预测和建议,都可能带来重大经济损失。


而无论是智能客服还是行业大模型,无论是政务领域,还是运营商或能源、政务、教育等行业,在央国企先行落地大模型的背后,有三点核心原因。


首先,在大模型时代,央国企多年积累的数据得以发挥作用,他们不仅仅包括像财报报表、交易记录等已经做好归纳整理的结构化数据,还包括一些重要的企业资产,如散落在各个系统内部的聊天记录、文件、图片等等,如今这些非结构化数据都可以在AI大模型中,变成“企业知识库”,并发挥其价值;


其次,不同于过去云计算时代从IaaS到PaaS再到SaaS的三层架构,大模型有着很强的协同性,只需在前期大模型开发阶段做好训练和微调,后期即可直接基于数据进行前端行为的加持。


最后,也是很重要的一点,央国企本身就有庞大的服务器集群,其自身具备强大的算力基础,基于这些基础可以更好地推进大模型落地。


竞争点:预训练、安全及行业know-how


从中标情况来看,可以毫不夸张地说,央国企撑起了国内大模型商业化的半壁江山。


然而,大模型落地进程行至中途,仍然有很多问题亟待解决。


据中信建设证券数据显示,2024年-2027年全球大模型推理的峰值算力需求量的年复合增长率为113%,远高于训练的78%。而预训练成本和推理成本的叠加,也推升了整个AI基础设施的市场份额。


据艾瑞咨询推算,2023年中国AI基础数据服务市场规模为45亿元,预计到2028年,其市场规模将达170亿元,且未来五年的复合增长率为30.4%。


这同时也解释了近两年央国企抢建智算中心的原因。然而,阻挡大模型落地进程的还不仅仅是算力资源短缺。


虽然大模型时代已经颠覆了过去从IaaS到PaaS再到SaaS的传统三层架构,但在新时代下,新的架构也迎来了一些新的挑战,比如从AI Infra到MaaS,再到上层的AI应用,中间涉及很多模型搭建的环节,这些都需要大模型服务商与企业一同探索落地路径。


对于央国企来说,用AI大模型赋能虽然已成为共识,但怎么用大模型,具体把大模型加在哪个环节,大模型如何发挥作用,以及如何开发和训练大模型,面对这些问题,企业并没有太多头绪。因此,这就给AI大模型供应商提出了更高的要求。


在这过程中,供应商是否掌握行业know-how,在有些时候甚至可以成为能否拿下标的的关键因素。对此,以百度、华为、科大讯飞为首的AI大模型企业,都不约而同地在2024年扛起“行业大模型”的大旗。


据统计,在能源领域,2024年上半年就出现了不少预训练过程中某项技术研究的投标项目。



另外,值得注意的是,随着AI应用走向深水区,数据安全、数据共享和数据溯源等问题则开始被一一搬到台面上。据悉,10月9日,中办、国办正式发布《关于加快公共数据资源开发利用的意见》,提出到2025年,公共数据资源开发利用制度规则初步建立;到2030年,公共数据资源开发利用制度规则更加成熟,资源开发利用体系全面建成。


虽然如今的AI大模型已经可以让数据溯源成为现实,但其中的责任划分和数据安全等等问题,还需要AI服务商和企业一同探索。


更多干货分享敬请关注我们的公众号与视频号~超多精彩对话内容等待您的解锁!
关于极新:

极新是垂直于产业AI的创投和行业研究媒体,致力于陪伴和记录科技企业进步和产业成长。已与多家平台和创新企业深度对话和合作,包括华为云、阿里云、百度智能云、金山云、飞书、火山引擎、钉钉、东软、Zoho、容联云、百家云等平台企业,以及智谱AI、百川智能、格灵深瞳、深势科技、百图生科、瑞莱智慧、创客贴、生数科技等高成长公司。

推荐阅读

2024投融资趋势追踪:1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 |9月


深度对话·创新&增长的源动力:创元集团 | 八友科技 | 松应科技 | 迁移科技 | 易参 | Databend Labs | 必优科技 | 鹿遥文化 | 卫瓴科技 | 极睿科技 | 新希望 | 微吼 | 致趣百川 | 奇酷网络 实在智能 | 演示大师 | 姿美堂 | 青松保 | 顺网科技 | 云蝠智能 | 小仙炖 | 惠买集团 | 菜百 | 宜创科技 | 百家云 | WeShop | 创客贴 | 行行AI | 一览科技 | 灵犀深智 | 金山云 | 订阅蜂 | 句子互动 | 询盘云 | 猎聘出海

极新
企业服务和硬科技垂直媒体,陪伴和记录科技企业创新与成长。
 最新文章