中国式大模型,产业实用主义

学术   科技   2024-11-17 19:00   北京  

当科技像烟花一样绚烂耀眼光芒四射时,不论是局中人还是局外人似乎都很难分清楚这是虚晃的幻术还是可以碰触的真实世界,此时,注重实践和结果的实用主义或许可以给出一定的行动参考。为产业所用,这也是中国大模型行业当下正在探索的生存之路。

在人工智能领域,大模型指的是拥有巨大参数量的神经网络模型。大模型究竟是一个跨越奇点的新科技,还是一场轰轰烈烈的造富运动,抑或是一门服务千行百业的好生意?从更大的视角看,大模型的真正价值在哪里?对于投身其中的大模型企业而言,其生存发展之道是什么?

1


沸腾的大模型

OpenAI在2022年11月推出ChatGPT,引发了一场波及全球的科技“海啸”,拉开了AI2.0时代的序幕。在中国,关于大模型的故事由此开始,并经历了从技术实现的浪漫到应用落地的验证的行业焦点变化。

兴奋期的跑马圈地

2023年是中国大模型技术的兴奋期。以百度、阿里、华为为代表的互联网科技巨头纷纷押注,进军大模型赛道,并很快各自研发了文心、千义通问、混元、盘古大模型,并不断迭代;人工智能领域的老兵科大讯飞、商汤科技也不甘示弱,持续更新迭代技术底座及模型能力;创业公司方面,互联网老兵也纷纷下场创业,李开复创办零一万物,王小川创立百川智能;还有智普AI、MiniMax、月之暗面,他们在大模型领域的布局,甚至更要积极和激进。

汹涌而来的大模型浪潮,甚至有些“乱花迷人眼”。一是关于风口的炒作。人工智能技术每隔几年就会有一次潮涌和爆发。而上一轮的风口似乎还是“元宇宙”“虚拟人”。大模型的风口足够热,创业公司们都拿出浑身解数,捕捉这轮机遇,“百模大战”由此而来。二是模型的迭代。在追赶OpenAI的跑道上,大模型版本也在极速迭代,大家疯狂打榜、升级参数。但这注定是一场深不见底的资源投入,训练基础大模型,需要数万卡芯片集群和云计算调度,并且还要夜以继日投入,一旦开启,就意味着碎钞模式。高昂的成本,也让行业在反思。三是应用的场景。有观点认为,生成式AI带来的技术浪潮不是百米冲刺赛,而是一场新的技术长跑。小冰CEO李笛就提到“大模型的技术方式处在一个剧烈震荡期。即使主流方向大概清晰,至少到2024年才能真正深入后方。现在处于‘1000米赛跑刚跑了3米’的阶段”。于是,2023年年中,对于大模型,中国科技界开始从狂热骤然转冷,进入加速落地的实用主义主旋律。

冷静期的落地验证

红杉资本在《Generative AI’s Act Two》(生成式AI第二幕)报告中指出,如果说生成式AI的首年是从技术实现出发,发现了基础大模型这个新“锤子”,那么来到2023年年底,进入到2024年,市场已经进入从客户需求出发的“第二幕”,提供端到端的解决问题。进入需求驱动阶段的大模型行业需要面向产业应用方证明自己的价值,而不只是面向问题抛出具有想象力的构想。

在国内,大模型的产业应用已经形成一种共识。腾讯云CEO汤道生判断,行业大模型已经过了“尝鲜期”,目前正深入各类业务场景,推动企业全链条智能化。成都智算中心CTO余明川预测,随着大模型应用加速进入行业生产系统,未来两年将深入超过50%行业核心场景。百川智能创始人王小川形容中美发展对比时提到“理想上慢一步,落地上快三步”,侧面反映了初创企业对大模型的定位。

企业在磨合中探索大模型赋能千行百业的路线,形成了一批大模型在产业端的应用,从制造到医疗、从政务到金融。大模型被普遍视为未来几年内产业数智化升级和传统工业转型先进制造业的重要迭代方向,得到了产业端的关注。基于此,行业大模型发布数量明显增加。根据国家互联网办公室于2024年8月最新披露数据显示,截至目前,已成功通过国家级备案的人工智能大模型数量达到188家。其中,根据名称可直接判定的行业类大模型占比超七成。由此,中国大模型走上了带着锤子(大模型)找钉子(产业应用)的路线。

2


让大模型在产业跑起来

中国大模型行业从跟着技术追跑到围着产业做事的新阶段,此时对于模型厂商的能力也提出了全新要求。360集团创始人周鸿祎对外采访时谈道,“大模型是个发动机,一定要给它装上轮子,变成拖拉机、跑车,才能用。

2024年,大模型确实在系列化、多模态、端侧协同等维度进行了能力升级。从模型集群看,目前广泛认可的大模型不单是一个单体模型,而是一个由基础大模型、行业特定模型、场景化模型组成的集群体系;从模态能力看,大模型从支持文本、图像、音频、视频等单一模态下的单一任务,逐渐发展为支持多种模态下的多种任务。大模型也从单一模型到多模态融合,从多模态理解到多模态生成的统一;从终端硬件看,大模型从云端不断走向终端,华为、OPPO、Vivo等手机厂商,以及联想等PC厂商,都推出了AI端侧大模型。那么,升级后有了“轮子”的大模型如何与产业对接?如何找到大模型与市场的连接点?为哪些产业服务?成为大模型企业要解决的新命题。

大模型找到客户:B端、G端、C端

大模型如何为个人和产业赋能,目前已经有了哪些实际的应用场景?我们将其概括为B端、G端、C端三类。

在服务政府的G端市场,度过旁观阶段的政府类客户成为大模型的拥抱者和尝鲜者,政务大模型也是大模型厂商垂直布局的热门赛道。中国移动“九天”海算政务大模型已在黑龙江省数字政府建设的多个场景落地应用,具体包括政务智能助手、政务大屏助手、“龙政智搜”引擎等社会治理场景功能。华为云“盘古”政务大模型助力深圳市福田区打造了全国首个城市大模型城区,其中一个政务服务为“政务智慧助手小福”,是利用盘古政务大模型对超过20万条政务数据包括12345热线、政策文件、政务百科等进行精调,提供政务智能办事助手、12345热线座席助手和企业营商助手等场景模型能力。

G端市场的应用场景主要有三类:一是面向公众的政务服务领域。大模型通过优化服务流程、提升服务质量,为公众带来更便捷高效服务体验;二是城市治理。多模态融合的大模型助力政府实现更为精准、全面的城市管理;三是服务内部政府办公领域。大模型则作为内部辅助工具,有效提高公务员的生产力和办公效率。虽然政务大模型已蓬勃兴起,但基础大模型的开放性不足且合规化审查缺乏统一标准、数据规模和数据质量参差不齐、数据安全方面的隐患、算力资源分散等方面仍是难题。

服务企业的B端市场是大模型的主战场。随着数字化转型深入,B端企业积累了大量的行业和业务数据。大模型能更好地利用这些数据进行深度学习和预测分析,为企业的决策优化、生产效率提高和成本控制提供强大支持。加之,云计算、边缘计算等基础设施的建设更加完善,为大模型在终端设备上的部署提供了条件,使得大模型能够在各种业务场景下实时响应,满足B端用户对快速、准确及个性化服务的需求。从行业来看,教育、运营商、能源、金融、医疗、农业、交通等行业大模型陆续上线,其中,国企、央企或龙头企业是大模型首批客户。可以说,将大模型与具体的行业、领域结合,做出垂直大模型服务于具体的应用,正在形成目前我国在人工智能领域的特色优势。


基础大模型的产业应用


从B端市场业务场景来看,各行各业的企业都在探索更细分的应用场景落地。医疗行业有医院采购大模型赋能心理测评系统;图书行业有企业希望用大模型来提升图书馆运营效率、服务水平;农业领域结合大模型探索粮仓管理;司法领域有法院用大模型来大打造智能辅助办案系统……B端垂类大模型的需求大模型更好带动云资源(MaaS模式)及行业产品方案的售卖,B端产品方案融合更多大模型技术,以API调用、SaaS产品及定制方案等方式加速了企业智能化进程。


MaaS模式下的AGI基础业态


总结以上大模型在政企类客户的落地模式,我们有以下发现:首先,从行业天然属性来看,这些行业或者领域大都有着深厚的知识背景、数据质量高、数据供给稳定这样的特点;其次,大模型已经落地的产业多偏向那些有刚需市场的行业,通过大模型提升效率来应对供不应求;最后,这些企业客户通常是基于技术能力和数字化基础来解决各自的产业问题。

此外,要应对复杂多变的产业细分场景需求,还需要整合多个模型、行业规则和系统接口,大模型企业给出的解决思路是智能体(AI Agent),通过智能体进一步来完成复杂工作流。智能体不仅是简单助手或对话搜索工具,而是能够解决实际行业问题的综合系统,集成了多年来积累的行业知识和小型模型,具备长短期记忆和规划能力。2024年,能明确看到的是智能体不仅体现在软件工具层面的进步,也伴随着智能硬件设备(如机器人、无人机)的智能化升级,实现了软硬一体的集成应用,进一步推动其实用化进程。如自动驾驶车辆中的决策系统、家庭服务机器人中的交互模块等。国内企业也更在加速竞争这一市场,如钉钉、飞书、金山办公、蚂蚁集团等。

C端市场方面,当基础大模型版本日新月异,产业大模型全面开花的同时,基于通用大模型原生AI应用也在排队上线,这类应用自诞生第一天就与大模型紧密捆绑,模型的能力也直接关系到这类应用的场景与体验。

从应用类别来看,在App Store中以AI助手为关键词搜索,首屏就有10个产品出现,比如字节豆包、百度文小言、Kimi智能助手、智谱清言、讯飞星火、腾讯元宝等;从用户类型上看,大模型原生AI应用面向的用户有两类,普通个人用户和专业个人用户,普通个人用户会偏娱乐场景,而专业个人用户通常作为生产力工具来使用;从使用场景来看,主要涉及职场办公、学习充电、休闲娱乐、搜索问答、效率提升、创意生成等。

此外,大模型AI应用也在向垂直领域发展。除了助手类应用,聚焦在内容创作、互动交流、教育和游戏等领域的垂类应用逐渐增多。如主打AI虚拟社交的星野,字节推出的AI角色扮演应用猫箱等,但依然缺乏现象级的C端应用。

大模型的营收:从烧钱到挣钱

2024年上半年以来,行业企业在解决客户及用户需求的过程中,面向G端及B端市场的变现路径逐渐清晰,已产生一定营收规模。

大模型是2B的生意,B端也正是国内大模型盈利的主要来源。面向大型政企客户的变现方式有大模型私有化部署、定制化解决方案、软硬一体化建设等服务。根据自媒体“数智前线”从中国政府采购网等渠道的不完全统计,2024年第三季度,市场上公开可统计的大模型相关中标项目数至少有369个。其中体现营收的金额方面,有十几万级别的小单,也有千万元到上亿元的大单。但考虑到中国B端市场的客户需求分散且烦琐,每类企业都希望实现满足独特的、定制化的需求,垂类大模型的定制研发也意味着更高的成本投入,尤其是对于场景复杂、数字化转型较晚的产业。此外,数据的不完善、质量偏低,需要大模型公司投入更多的人力,从底层开始执行智能化设计,成本就更高。

与政企类大客户不同,面向中小企业的大模型服务多是通过API调用的方式来实现,是一种轻量的接入方式。大模型企业会按照时间段、按调用量来分级收费。进入2024年,头部互联网公司加大对大模型投入并发起价格战,大大降低了中小企业使用大模型的门槛,各家大模型平台的Token消耗量都在快速提升,由此也反映出降价背后是大模型企业以规模换市场的策略。

对于大模型厂商而言,另一个可以期待的商业变现是2C生意。目前,C端市场大模型应用产品多以免费为底,提供会员订阅与资源购买。如Kimi的打赏功能和文小言的仅先进版本付费,特别是2024年爆火的AI视频生成产品,如快手可灵,C端用户付费渗透率更是不及预期。成本方面,与B端的技术研发投入不同,C端应用产品要想实现规模收益还要考虑流量推广的成本花费。不得不说,国内大模型厂商在各个落地场景的变现探索,目前仍处于理想很丰满、现实很骨感的早期阶段。

3


大模型玩家的路线分化

经历了百模大战的国内大模型企业,进入到产业落地的较量中。2024年以来,这种强调行动与结果的“实用主义”,为大模型相关企业提供了一种直接而有效的生存策略。本期封面选取了六个大模型企业,根据自身业务选择了不同的发展路线。

百度云:侧重基建,大力发展AI原生应用

百度是最早布局大模型技术的互联网巨头。百度大模型布局实用特色的表现有:重视基础设施和强调AI原生应用。百度从2019年投入大模型研发,并已形成从底层硬件到应用层面的一站式服务能力,并积极布局大模型以及配套的算力管理平台、模型和应用开发平台的新一代生成式AI的基础设施,面向各类政府及行业提供端到端的大模型服务。百度智能云千帆大模型平台的产品矩阵,展现了其在AI原生应用的生态式布局,众多客户已在百度千帆平台上开展服务。


百度云“云智一体”


华为云:大模型生于产业,服务产业

华为云大模型布局的实用特色表现在:一是算力国产化;二是软硬一体;三是生态兼容。首先,华为云盘古大模型实现了算力的国产化。华为云训练盘古大模型用的包含GPU在内的芯片,均为华为自研的昇腾芯片;其次,华为几乎是业界唯一同时拥有云侧大模型和端侧大模型,以华为云作为统一云底座,打造了昇腾、鲲鹏、鸿蒙、欧拉、GaussDB等根技术及相关生态的厂商。华为云大模型服务的软硬一体化趋势明显,其合作的大部分客户订单既包含了模型及相关的平台软件,也有算力、存储、网络等硬件设施;最后,华为云认为,大模型真正走进千行百业不仅仅是技术问题,还需要生态的建设,提出了“硬件开放、软件来源、使能伙伴、发展人才”的生态理念。


华为云盘古大模型5.0


字节跳动:实用就是硬道理

作为最晚进入B端大模型市场的互联网巨头,字节跳动的大模型的实用特色有:一是价格战。字节首先打响大模型的价格战,火山引擎这次降价直接搅动了市场,引发大模型算力推理成本的行业性普降;二是产品矩阵。字节继续发挥产品矩阵的特色,上线了AI原生应用的全家桶,如AI创作领域,字节跳动上线了包括星绘、即梦、即创等多款产品;三是应用开发平台。火山引擎推出扣子专业版AI应用开发平台,企业IT部门或开发者可以“搭积木”的方式拼出适合自身的轻应用。

AI老兵的科大讯飞

在人工智能核心技术的研究上,从文本到语音识别,从最初应用深度神经网络到语音识别,再到最近对预训练模型的优化,科大讯飞一直未缺席,算得上是AI行业老兵,实用特色的表现有:强调服务B端政企客户,用更少的算力更高的效率打造企业专属大模型。目前已经在电信运营商、金融、教育、医疗形成优势赛道,主要负责建设大模型工具平台、教育行业大模型和医疗行业大模型,价值近亿元。此外,不少企业和学校也在采购科大讯飞融合了大模型能力的智能办公本硬件设备,科大讯飞在大模型办公赛道的软硬结合,成为不少用户花小成本体验大模型时候的选择。

蚂蚁集团:金融大模型

与其他大模型企业不同,蚂蚁集团的基因是金融科技。基于支付宝的大数据积累,蚂蚁集团自研的基础大模型“百灵”之上推出金融大模型,发挥金融行业的优势,相继布局支付宝医疗大模型、蚂蚁代码大模型等行业大模型。此外,蚂蚁集团还从应用着手,提供轻量式工具,发力专业智能体,加速产业应用。

AI初创企业Kimi:聚集生产力场景

科技巨头和创业公司往往有着不同的发展目标。大模型初创企业的光环效应也让他们更受关注,巨额融资的背后,这些公司需要要把融来的资金,投入高昂的科研中追赶OpenAI。因为资本入驻,这些初创公司也需要考虑商业化,在落地场景上寻找可能。由杨植麟作为创始人创办的月之暗面Kimi就处于这样的发展道路,不同的是,Kimi更加聚焦生产力的场景来进行产品的技术升级。

4


结语

这一年,我们见证了大模型的从理论到实用的转变。人工智能技术发展这么多年以来,这期间,我们旁观了数字人到元宇宙再到大语言模型的爆火与理性回归。不得不说,当前的大模型还处于早期的起步阶段,距离真正的通用人工智能,还要经历数个类似的技术演进才可能会更清晰。因此,大模型的能力尚存在一定局限性,在应用落地层面仍需要进行相对复杂和克服挑战的创新突破,大模型产业落地的道路注定不会平顺,甚至还可能相当凶险。

必须看到的是,产业实用主义为中国大模型带来了新空间和新机遇,在全球人工智能大模型时代,中国有望在产业大模型应用落地的过程中抢得先机。即使是这样一个充满荆棘的未知之路,也因为梦想本身而值得。


更多深度好文


点击下方文章标题,立即阅读最新行业热点、业界趋势

合辑 | 风云再起视频化

合辑 | 奥运百年品牌道

合辑 | 广告技术论

视点 | 大模型之三观



购买最新杂志


长按下方卡片识别二维码,购买最新杂志



关于我们


本文编辑:王佳梁

本微信号由中国传媒大学广告学院《媒介》杂志独家运营

版权所有,违者必究


点击下方卡片,关注公众号,第一时间获得最新深度资讯

媒介杂志
整合传播传统及新媒介资讯,分析行业热点事件,探索业界趋势
 最新文章