原本这篇文章计划在3天前发的,然而 DeepSeek-V3 的横空出世迅速在行业内引发广泛讨论,甚至吸引了硅谷多位 AI 领军人物的关注。我决定先研究了解一下DeepSeek,果然没让我失望。
深入了解 DeepSeek V3 后,我对 AI 行业的未来有了新的想象:这项技术不仅有望影响大模型的格局,还可能从根本上缓解当前高企不下的基础设施与算力成本,并为下一代 AI 大模型的训练发展提供新思路。
“规模不经济”是当前AI落地的一大痛点
近年来,算力成本已成为 AI 模型训练的主要瓶颈,大幅抬高了行业门槛。OpenAI 虽然在产品实力与用户规模方面都极具优势,但预估 2024 年亏损将达 50 亿美元,2026 年会飙升至 140 亿美元;而谷歌也计划在 2024 年向人工智能投入 1200 亿美元。为了营收,甚至玩起了互联网时代的“卖广告”的老套路:AI 搜索引擎 Perplexity 已在搜索结果中插入广告,OpenAI 也在考虑类似的变现方式。若这些巨额投入无法及时带来相应回报,资本市场对 AI 领域的信心势必受到影响。依靠大量显卡搞“大力出奇迹”这事怕是不可持续。
因此,控制成本、实现技术普惠,成为打破巨头垄断、追求规模经济与释放AI创新潜力的关键。DeepSeek 的模式所展现的“工程化创新”切入点,让行业看到了从“巨头主导的大规模烧钱”向“开放高效生态”转变的可能。事实证明,大规模烧钱,
高算力成本是目前AI大模型场景应用创新的重要阻碍
自 2023 年落地首个大模型项目开始,我们就在团队内部设立了目标:在有限时间与有限信息的前提下,用最高效率、尽量少的算力,达成最低错误率的结果,以此保证可控成本与效益最大化。
为达到这一目标,我们在模型结构、数据质量、Prompt Engineering、Agent 等多个环节投入了大量精力,力求在参数规模相对较小、用户数据不完全达标的情况下,依然满足预期并实现成本可控。
即便如此,有些 AI 大模型应用项目的算力成本依然占总成本的一半以上。正如我常戏称:“应用厂商成了给 GPU厂商的打工的”,这绝非正常现象,这个世界不应该这样!
天下苦英伟达久矣!
DeepSeek-V3 展示出的新技术路径至少证明,通过架构优化和精度改进,能显著降低对算力资源的需求,从而为未来大模型的发展带来更加可持续的选项。当基础设施处于起步阶段时,单位成本往往高得惊人,阻碍市场的广泛撬动;一旦基础设施成本下降,触发网络外部性或规模经济,便能催生更多产业升级与创新。
DeepSeek 的推理能力做到与GPT 4o 和 Claude 3.5 Sonnet 相当,但是算力仅用了前两者10分之一的处力,如果是这样的话,算力还会紧缺吗?这对算力市场可能会有很大的影响 。
硬件优化、算法创新以及政策扶持,都可视为降低算力开销、激活市场潜力的有力抓手。DeepSeek V3 的出现,为行业提供了一种更高效的工程化思路,让我们看到了兼顾技术突破和成本控制的可能性。当基础设施的成本下降时,其服务的可及性、普遍性都会显著提升;这会降低创新者的进入门槛,从而带动大量新产品、新模式、新场景的涌现。
摩尔定律的启示
我们可以参考摩尔定律,摩尔定律带来的芯片性能飙升与成本下降,让计算机与互联网技术迅速普及,逐渐演变为数字经济的基石。同时摩尔定律不仅是技术命题,也是产业分工的结果:从设备商(如 ASML)到晶圆代工厂(如台积电)再到设计公司(如英特尔、AMD 等),整个产业链形成了一整套标准化、专业化的协同模式,通过量产规模来摊薄研发和生产成本。即得益于行业大规模化协同与又得益于投资驱动。
“ChatGPT是通用人工智能的iPhone时刻”说早了
2023年黄仁勋(Jensen Huang)曾说“ChatGPT是通用人工智能的iPhone时刻”,但经过一年多的情况来看,黄仁勋“过于乐观”了,他的表述更多是“愿景”,而非事实,AI大模型根本不具备 iPhone当年在基础设施、技术标准、开发者生态等相当的环境。
2007 年的 iPhone 时代的移动网络与操作系统等基础设施相对成熟,而当前的AI 算力与模型训练仍在快速演化阶段,硬件与框架尚未形成事实标准。且iPhone 推出后移动网络、开发者生态和消费者习惯很快就大规模融合;ChatGPT 虽然引爆了AI热潮,但其后续的大规模落地仍需更长的技术迭代周期。移动应用门槛相对低,任何开发者或公司都可在标准化硬件上开发 App,面对海量消费者。模型训练与部署对算力和数据要求极高,大规模普及的速度与路径更复杂。
行业的兴起往往伴随着标准化程度的提升
除去基础设施的成本和技术成熟度不谈,纵观计算机和信息产业历史,行业兴起往往伴随着标准化。通过我与一些大模型研发企业的沟通情况来看,行业目前存在于“技术碎片化,生态碎片化”,不少企业在“重复造轮子”。
当前大模型企业技术碎片化,不同公司和研究机构开发的LLM在架构、训练方法、优化技术、API接口等方面存在显著差异,导致互操作性差,增加了开发成本。例如,OpenAI的GPT系列、Meta的LLaMA、Google的PaLM等在训练框架、推理优化和模型架构方面并不统一。标准化本质上减少了冗余与不确定性,能促进大规模大范围合作,使得固定成本得以在更大规模上分摊,从而产生规模经济或规模效益。比如互联网时代的TCP/IP、Wi-Fi等通信协议、HTML、HTTP等万维网核心标准极大地推动了无数应用场景的诞生和普及,形成了巨大的经济与社会效益。
这点在国内GPU算力企业也类似,类似CUDA,各GPU企业大多都有开发自研的框架,如摩尔线程的MUSA,昇腾的 CANN 、壁仞的 BIRENSUPA 、沐曦的 MXMACA ..…。把各家都要做的适配工作拆开来看,工作重头戏之一就是实现算子库的支持,各家的实际支持度和路线不完全相同,但是也不少“重复造轮子”的工作。
目前竞争格局下,如果开发者要跟哪家合作是都学一下哪家的开发框架,决定了市面上难以长期同时存在大量的生态,这样的状况会推高用户的学习成本,每家都要各自花大量的时间和资本去建生态,要消耗大量的成本。
光哥认为在这样的生态碎片化的情况下,要想打破英伟达的技术壁垒和生态壁垒举步维艰。这个需要企业能政府思考如果构建开源的标准化的共享软件框架技术生态体系,可能更有利于国产GPU产业的快速推进,当然这是一件非常困难的事情。
场景是未来算力投资的重中之重
前段时间光哥在与某地市主要领导沟通智算中心落地事项和与一些潜在大客户交流时,出人意料的是不管是政府领导还是企业负责人,都十分关注一个问题:落地智算中心的未来应用场景是什么?
智能中心投资逻辑将较前几年会发生转变,但这是好的转变。基础设施的建设驱动力开始考虑“需求驱动"因素,只有基于真实需求,才胡避免制造“虚假繁荣”,AI产业链上的企业和平台才会获得正向、可持续的发展循环。从真实需求场景落地,就要尊重市场规律,就要考虑客户预算和成本。如果仅仅依赖投资驱动而无产业需求落地,没有清晰可行的可落地的商业化路径,仅用“融资额”“估值”来衡量项目成功往往不靠谱,可能会沦为金融资的的击鼓传花的游戏。AI产业需要投资驱动与需求驱动两大动力的相互作用。产业协同与生态共建,政府-企业-科研机构-风投等多方联动,共同形成一个良性生态体系,才能将初期的投资驱动有效衔接到后期的需求爆发与产业升级。
Agent智能体是不错,但不足以撑起AI大模型应用
从2024这一年的论文还是产品路线来看,AI Agent的是有发展前景的,是备受关注的,但可能没有一些宣传的那么神奇。
AI Agents(智能体) 现在市面对它的定义也很乱套,实际上AI Agent应该叫 LLM Agent(大模型代理)更合适。“Agent”一般会翻译成“代理”,把Agent翻译叫“智能体”的人真是个天才。
AI Agents 通常指的是一种能够自主感知环境、决策并采取行动的人工智能系统。它在执行任务的过程中可以结合上下文信息、目标和规则,进行多步推理和实时适应。AI大模型(如单轮对话、自动文本生成等)往往停留在“输出结果”的层面,缺乏连续执行复杂任务的能力;而AI Agent在此基础上更进一步,强调闭环:即从感知到决策,再到行动和反馈,不断循环与迭代。Agent更侧重“自主执行、主动行动”的能力,严格意义上来讲“AI代理”或“自主代理”有时更能直接体现其行动属性。
但Agents的能力并不足以解决AI大模型的局限性,也无法确保其广泛的适用性和接受度。当前市面上的AI Agents产品并没有完全实现理想目标,许多Agent基于特定任务设计,无法跨领域泛化。随着任务复杂性增加,代理对算力需求呈指数增长。这也是AI 大模型在推理效率和成本上的主要矛盾。多Agent系统在协同任务时的协调成本高,容易导致效率低下。鲁棒性不足。特别做为大模型的“代理”,如果“基座“AI大模型本身就不太行的话,那也很难办。
为了克服这些挑战,需要从多维度入手。光哥的团队已经在Agent产品的研发上投入了不少精力,从近一年实际产品研发的情况来看,Agent恐怕并不是AI大模型应用的杀手级技术解决方案。前途是光明的,道路是曲折的。
AI大模型离AGI目标还很遥远
当前的AI大模型虽然在某些领域表现不错,但距离真正的智能还是有差距的。模型在语义理解、推理和真实世界的复杂应用中仍有诸多瓶颈。AI大模型在面对陌生情境时表现不太行,如人类在互动中的意图理解依然很差。它们仍然缺乏人类智能所具备的适应性,以及推理、规划和反思的能力。大模型其内部机理在很大程度上仍是一个“黑盒子”,只体现了数字计算的过程,难以呈现实际的决策逻辑。缺乏透明度不仅阻碍我们理解其成功或失败的原因,更为关键的是,它使我们对其在安全性以及是否符合人类价值观上担忧。如果我们无法理解AI的推理过程,我们凭什么信任AI呢?
下个机会在哪
所以,当前 AI的现状,既有基础设施成本的挑战,又有生态发展的问题。技术创新,工程化创新下,AI 行业有望从巨头主导的高成本AI模型训练的战争转向AI应用为核心的竞争。红杉资本把当前的在基础设施层,无论是AI大模型(国内的智谱AI、DeepSeek、百川、传统互联网巨头.....)还是GPU(摩尔线程、昇腾、沐曦、海光.....),不管软硬基础设施目前情况如何,都已经有很强的玩家入场了,可以明确看到AI应用层与支撑层都仍是极具潜力的新大陆:前路充满挑战,但机遇同样巨大。随着大模型技术的不断迭代与行业需求的具体化,填补这些“白板空间”的过程,就是下一波“AI 时代”公司群体崛起的过程。
红杉资本报告 “Generative AI’s Act 01: The Next Technological Revolution”
链接:https://www.sequoiacap.com/article/generative-ais-act-o1/
在算力成本居高不下、大模型尚未成熟且缺乏杀手级应用的当下,创业的核心是“价值耦合”,即在合适的垂直场景中,用精巧或差异化的方式,将现有大模型/AI 技术与行业需求精准结合,形成可见的商业价值。AI 大模型的未来仍充满变数,但可以肯定的是,以用户价值为导向、深度融合行业场景、构建可持续商业模式,才有望在这场“下一次技术革命”中屹立潮头、行稳致远。
感觉就像哥伦布刚到美洲新大陆,处处是路,但处处不是路.....