我们的应用正在逐渐成熟,应用本身带来的附加价值,最终会在某个时点赶上其成本。这才是问题的关键。我们现在讨论的token,不仅仅为程序员提供高效编码能力,我们更希望这样的模型能够更加贴近实际需求。目前的情况是,人类在辛苦地进行各种重复性工作,而AI却在阅读、绘画和写作,这与我们最初的期望是完全不同的。
文 | 曹宇(博士、阿里巴巴大模型算法专家)
*本文系作者参加“九派圆桌”《生成式AI:泡沫将至?》议题讨论发言,经审阅发布
01
生成式AI的应用还在培养用户习惯、收集需求
AI已经形成了一个完整的产业链,它不仅仅是AI技术本身。如果我们从整个产业的角度来看,就会发现产业内部有明确的分工。从最基础的层面来看,与AI相关的硬件芯片制造商,如英伟达、华为等,它们仍然保持着良好的盈利状态。这种优势是由基础设施的先进性和技术领先性所决定的。
在硬件之上,AI领域最关注的是云计算和云基础设施。这一领域的盈利模式已经相对明确,主要是通过销售资源型的服务。各种模型厂商和应用提供商,它们的角色更像是零售商,将大量的算力批发给有需求的应用方使用。
我们也看到,国内一些领先的厂商的盈利模式逐渐清晰。但目前看来,情况并不乐观的是模型层之上的一些业务应用领域。大模型本身是一个高投资、高回报且回报周期长的事物。以OpenAI这样的行业领头羊为例,它们在研发上的投入已经超过五年。
如果我们回顾早期的GPT系列,考虑到它们的历史总研发成本,其回报周期是相当长的。但我们也应该清楚地看到,在这个长回报周期中,订阅用户数、API调用量以及每天消耗的GPU算力一直在增长。即使现在ChatGPT的订阅用户量已经达到顶峰,但对于商业级用户来说,对头部模型的需求仍在不断增长。
再来看整个产业链的上游,更像是我们所说的大模型的应用层。说实话,大模型的应用层现在出现了一些两极分化的情况。一方面,国民级的AI应用占用了大量的GPU资源,但并没有特别明显的商业盈利模式。我们目前使用的大多数APP也是免费的,不需要像传统模型那样收取订阅费。这恰恰反映了一个现状:许多APP还处于早期应用形态,许多厂商还在培养用户习惯,并在这个过程中收集真正的用户需求。
因此,从整个产业链来看,不同层的厂商或不同层的业务形态,它们的盈利模式和周期都是不同的。有的厂商可能感到乐观,有的可能感到忧虑。
英伟达的股价近期波动,很容易让人联想到市场对这个行业的信心和期待。从长期来看,尽管短期内有下跌,但英伟达过去一年的累计涨幅仍然相当可观。市场环境,尤其是美国资本市场,与投资者情绪密切相关。他们对英伟达能否在未来的生成式AI领域保持领先地位并继续获得超额利润持观望态度,这种情绪在很大程度上影响了市场对英伟达的看法。
市场的这种情绪并非没有道理。英伟达的芯片因为封装工艺问题导致交付延迟,这对资本市场来说是一个不利信号。同时,英伟达对大客户的依赖性很高,其大部分收入来自美国几家进行大模型训练的公司。然而,在当前美国大力投资基础设施建设的背景下,其他公司也对英伟达的市场虎视眈眈,没有人愿意忽视这块利润丰厚的蛋糕。此外,英伟达的一体化销售策略可能会促使大客户考虑建立自己的系统。
从技术角度来看,英伟达是一家非常有耐心的公司。自其深度学习计算芯片问世以来,英伟达投入了大量资源,甚至在研究人员还处于学术阶段时就开始提供帮助和赞助。这种长期的投入培养了用户的使用习惯,现在正是英伟达收获的时候。
然而,我们也必须注意到,技术发展并非总是一帆风顺。例如,GPT-5的开发已经持续了很长时间,但至今仍未发布,这对市场情绪和OpenAI继续销售其最先进模型的能力产生了影响。这些纯技术因素,加上市场的其他消息,都是我们未来可以深入探讨的话题。
从我观察到的趋势来看,成本无疑是在不断上升的阶段。无论是国内的互联网巨头还是初创公司,他们都处于一个充满活力的阶段,希望在未来竞争激烈的市场中分得一杯羹。
在这其中,最主要的两个研发相关成本是算力投入和人力研发成本。这两个因素可以说是成本上升的主要驱动力,这主要是由于这两种资源本身的稀缺性造成的。
其次,大模型研发过程中人才的稀缺程度也是一个不容忽视的问题。对于大模型而言,训练核心算法、调整策略或进行算法策略的迭代可能是最终算法和应用表现的最重要因素。因此,掌握相关技术的人才在市场中的价值也在不断上升。有传言称,一些OpenAI的前研究员的薪资可能达到了数百万美金的规模,这实际上并不比相应的训练资源成本低。
此外,我还提到了国内许多产品,包括大模型应用,都集中在产品侧。产品侧的运营推广和流量曝光费用,在较大规模上也是相当可观的一笔开支。在这些领域,由于资源的稀缺性和渠道本身的竞争趋势,我们看到的成本或开支趋势一直在上升。
英伟达全球总部。图/cfp
02
在产品和技术领域,我们常常不得不面对一个敏感话题,那就是产品的投资回报率(ROI)。坦白说,目前许多产品的ROI相对较低,我们更多的是在用ROI来换取增长。
在这个过程中,我们实际上在关注两件事情:一是ROI的关注点不应仅仅局限于经济利益,尤其是在技术早期阶段,我们更关注它能否带来巨大的经济价值。二是AI技术与其他技术的不同之处在于,人类历史上很少有机会对一项技术倾注如此多的情感,我们几乎像对待人一样去训练它。在华语地区,对于大模型的训练,我们通常称之为“训练”,而在港台地区,则更倾向于使用“培训”这个词,后者更具有人情味。
我个人对ROI的看法是,目前我们使用的这套评价体系,它判断产品成功与否的标准是基于一个相对较短的时间周期内的价值。如果我们将产品的ROI周期延长到18个月甚至36个月,我们可以清楚地看到成本下降的趋势是非常明显的,这一趋势不仅在国外明显,国内也有很多公司在这条道路上快速发展。
当我们做出投资技术的决策时,我们考虑的最重要的点并不总是纯粹的短期物质回报和利益。以OpenAI为例,它的许多创新点纯粹是出于对技术本身的热爱和对真理探索过程中迸发的机会。如果没有像OpenAI这样的公司,我们的世界可能会有所不同,但有了像ChatGPT这样的技术和一群专注于技术的热爱者,他们将对技术的初心发挥到了极致,为我们提供了提升AI能力和认知的机会。
另外,如果将视野聚焦于AI技术本身,我们发现AI行业已经经历了多年的起起落落。我们之前也经历过多次所谓的“AI寒冬”,每一轮寒冬都是在技术上遇到了难以突破的瓶颈,当时人们对这项技术持有很大的悲观情绪,或者认为它是不切实际的。
每一轮新的AI浪潮都是在吸取了之前的错误基础上,发展出新的范式和方法。因此,我们当前的AI热潮和对AI的期待,是在前两次寒冬的基础上充分吸取了经验和教训,并在范式上尝试创新和修改。在这个不断变化的世界中,我相信只有通过不断的创新和试错,我们才能更接近我们追求的真理,以及我们追求的更智能的范式。
AI 技术未来它要发展到什么样的一个程度,才能够说我们产生这种收支平衡的一个效益,或是说缩短收益的一个效期?
这个问题具有很强的技术前瞻性,同时也涉及一些务实的技术解决方案。据我观察,我们至少可以在两个方面解决目前面临的技术问题:一是硬件成本的持续降低,二是新硬件架构对我们整体成本下降的贡献。
在美国,有一家独树一帜的公司名为Soho,它做出了一个非常大胆的决策,将整个公司的资源和信任都投入到大语言模型未来能够成功的道路上。它在芯片的底层设计中就融入了对transform结构——也就是大语言模型的核心——的深入理解。这种专有硬件的设计,可以在现有成本基础上,将每个token的推理成本降低10倍到100倍。然而,由于其通用性受到很大限制,它的成功高度依赖于transformer在未来的表现。
另一方面,在算法领域,我们也有了惊人的发现。现在有效的算法不仅仅只有transform结构一种。例如,国内团队开发的一个名为Ra的库,它是一种自回归的轻量级小模型,我们惊讶地发现,一些国外大厂,比如微软,在Windows系统中也开始尝试使用成本较低的CPU资源来进行推理替代。
从算法和硬件两个方面,我们都发现了一些令人期待的亮点。但除此之外,我们还可以关注到除了纯技术因素之外的其他方面。实际上,我们的应用正在逐渐成熟,应用本身带来的附加价值,最终会在某个时点赶上其成本。这才是问题的关键。我们现在讨论的token,不仅仅为程序员提供高效编码能力,我们更希望这样的模型能够更加贴近实际需求。目前的情况是,人类在辛苦地进行各种重复性工作,而AI却在阅读、绘画和写作,这与我们最初的期望是完全不同的。
03
AI 以何种形式与社会、人类、国家交互
研究还非常少
互联网早期的发展,大多数是基于我们现在所理解的结构化数据。这种方式成本相对较低,且能快速见效。所有的数据,比如年龄、偏好、习惯等,都通过大量的人工或自动化工程,以表格和字段的形式存储在数据库中。
结构化数据之所以成为互联网服务的基础,是因为其处理、存储和消费的成本相对较低。然而,我们所生活的世界实际上是非常非结构化的。我们在对话中,以及日常生活中的许多习惯,很难通过一个字段或一个冷冰冰的数字来表达。我们希望通过大型模型,能够充分利用非结构化数据中蕴含的信息和内容。
目前,这些场景可能并不容易被大众直接接触到。例如,非结构化数据处理和用户习惯总结,很难通过传统的大数据方式来实现。在这个领域,大型模型已经开始在幕后发挥各种作用。
以我们正在进行的对话为例,过去在会议中,我们需要专门的记录员来记录会议内容。但现在,如果我们使用市面上的一些软件,AI进行会议记录和总结的精度和成本已经大大降低。这相当于为每个人配备了一个会议记录员,其成本肯定远低于雇佣一个专业记录员的费用。这是一个非常具体且贴近实际的例子,我们每个人都拥有了随身的数据助手。
至于大型模型对整个行业、GDP以及国家经济的推动和贡献,未来会如何发展,每个人都有自己的推测和想法。这也是每个人关注技术的角度和期限不同所导致的。
风险投资者可能更关注长期趋势,而宏观投资者可能更关注技术对产业格局的影响。像我们这样的普通技术从业者,可能更多地关注技术本身的兴趣点和成长潜力。至于对GDP的推动,我们可以认为当前AI浪潮与上一波AI浪潮中的部分泡沫有关。在上一波AI浪潮中,我们积累了可能过量的GPU资源,为当前AI浪潮奠定了基础。未来这个泡沫是否会破裂,或者被更多技术创新所充实,将取决于每个行业从业者和用户对我们技术的接受程度,这仍然是一个存在较大不确定性和变数的问题。
我认为技术更多地与人的需求相关,而不仅仅是技术本身。我们注意到,原来的互联网泡沫时期,我们有时过于关注技术本身,反而忽视了技术是为人民服务的这一本质。在互联网泡沫的早期,我们过分强调了互联网提供的快速便利的能力,以及高速带宽等各种未来使用形态,看起来过于科幻。但实际上,互联网泡沫发生的原因之一是,那个时代的互联网并没有现在这么多接地气、与人相关的好用应用场景。
例如,在互联网泡沫时期,网上购物几乎是不可能的,因为我们过分强调了互联网的信息交流能力,却没有意识到人们使用互联网的目的是为了服务于人类自身。当然,这个比喻放到现在,对于AI,尤其是新一代AI,许多人都在讨论AI技术本身的瓶颈和问题,但忽略了AI生成式技术与人之间的关系。AI技术究竟以何种形式与我们的社会、人类、甚至更广泛地说,与我们的国家进行交互,我们的研究还非常少,因为这不仅涉及技术问题,还涉及包括对模型的信任、安全问题等复杂交互形态。
因此,如果我们以史为鉴,吸取上一波互联网泡沫中的问题,现在最好的行动初衷或方法应该是思考技术和人本身需求的关系,以及与社会的交互应该是怎样的形态,而不仅仅是建设了一条漂亮的高速公路,却没有车辆来往。
关于这个问题,高盛的报告给出了一个相对谨慎的判断:由于大模型的能力限制,它们可能替代的主要是一些相对低薪的工作岗位。然而,我们最近也在思考,上一波AI热潮中,大模型对人类的替代作用不仅限于简单工作。以AlphaGo为例,它不仅横空出世,还击败了人类最伟大的围棋棋手,这在生成式AI领域尚未见到同样惊人的情况。但在特定领域,我们已经看到了大模型的潜力,比如谷歌的DeepMind使用其大型模型在数学竞赛中取得了相当于铜奖的成绩。
这种情况下,我想引用当时人们对AlphaGo的看法:自从AlphaGo战胜了人类顶尖棋手后,人与AI的关系已经从单一的对抗转变为一种亦敌亦友的复杂状态。在很多情况下,人类顶尖棋手实际上需要向AI学习,AI也改变了围棋的整体竞争格局。
过去,许多人学习围棋是依照传统的棋谱和对棋局的理解来进行的。但在AI领域,我们是否可以探索一种新的可能性,即AI与我们的关系不仅仅是竞争或替代,而是成为一种亦师亦友的伙伴关系。在这种关系中,AI能够教给我们一些东西,同时我们也能教给AI一些东西,这应该是理想中AI与人类互动的形态。
AlphaGo击败韩国棋手李世石。图/cfp
04
中国在大模型创新方面相对较为跟随
中国拥有全球最大的移动互联网市场,我们每个人对互联网、移动互联网高质量信息的需求都在不断增长。因此,在中国市场中,我们发现最早出现的是一些轻量级的应用,比如AIGC绘图、具有漫画风格的拍照功能等,这些都是非常贴近用户需求的方法。这与美国将AI优先应用于ToB市场,服务企业级市场的做法有所不同。
这种差异与我们庞大的互联网用户基数和相对完善的基础设施建设密切相关。在良好的基础设施支持下,即使是AI游戏,也能采用集中式推理模式,从而降低每次请求的成本。这在一些欧美国家并不那么容易实现。同时,我们的智能手机和智能硬件的普及率在全球也是名列前茅,这是中国市场的优势,但我们也不能忽视自身的短板和长期基础设施建设的需求。
国内AI的发展仍然依赖于高端GPU芯片或华为高端NPU芯片等算力基础。在这方面,中国头部玩家的规模与国外头部玩家相比,还存在量级上的差距。至少我们可以看到,一些国外玩家拥有超过10万块的GPU加速卡,这有助于他们快速进行最新的训练,并将训练结果迅速应用于To B的商业闭环中。这反映了中美在大模型应用的细节和方向上的差异。
我认为中国在大模型创新方面相对较为跟随。大模型架构本身是由美国谷歌公司首先发明的,包括许多我们现在熟知的大模型训练方法,也是基于国外同行的基础。然而,尽管存在这些短板,国内仍有许多优秀的研究者在努力追赶这两个趋势,使我们在大模型的基础研发和算法创新方面能够迎头赶上。
在我看来,目前我们国家对AI的定位以及对其作为新质生产力的理解已经深入人心。早期,我们可能认为私人AI,如ChatGPT,只是一种聊天工具,用于闲聊。但很快我们意识到,它实际上是一种能够在某些方面替代人们进行低层次重复劳动的新质生产力工具。
在这种定位下,无论是从应用向基础设施建设发展,还是从基础设施建设向应用迈进,我们都有一个明确的发展方向。我们对生成式AI的期待是,它不仅要在简单的闲聊或对话场景中发挥作用,更要将其新质生产力的能力赋能到各行各业。
例如,阿里希望为用户提供信息获取上的服务和便利。但在偏远地区,由于上网不便,人们对AI的了解非常有限。在这种情况下,我们如何让他们对国家新质生产力的变革有一个基本的了解呢?阿里做的一个基础尝试是,利用AI帮助偏远地区的学生进行高考志愿填报的参考。
这在我们应用的领域中只是一个非常细分的小领域,但它实际上能够帮助学生,就像有一个经验丰富的老师一样,耐心地与他们进行对话。这样,我们就消除了信息获取上的一些不公平现象。我相信,随着越来越多的应用场景的出现,基础设施和应用之间的协同效应将越来越强。到那时,我们在软件供应上的短板和缺陷,可能会有机会迎头赶上。
END
《 过 刊 》
往期内容精选
热点话题 | “黑神话”引爆“悟空宇宙
©原创稿件版权归九派新闻所有,转载前请先获得授权。
若稿件内容涉及错误或侵权,请联系我们及时沟通处理。
邮箱:jpbl@jp.jiupainews.com互动微信:jpcjbl