2025年前后,AI的发展将走向渐进式、务实式的持续落地过程

科技   2024-12-23 10:54   北京  

以场景为牵引,形成端到端的能力,才能立于不败之地。




编辑 | 雷小寒

12月18日,由亿欧主办的WIM2024创新者年会在北京威斯汀酒店正式拉开帷幕。

本届WIM创新者年会以“AI For X 未来产业范式跃迁”为主题。这是中国第一场专门聚焦“未来产业”的千人峰会——会议邀请了来自未来产业界的100+位头部企业专业嘉宾、超过2000位行业从业者齐聚一堂,共同总结2024年未来产业创新成果,预测2025年最新创业创新趋势。
本次大会在北京、上海、深圳三地举办,三城联动、持续三天(12月18日-20日),会议以独立演讲、圆桌论坛、报告首发、百人晚宴、榜单发布等多种丰富形式,为大家带来一场商业视听盛宴!
2024年是世界创新者年会(World Innovators Meet,WIM)走过的第十个年头。十年来,中国科技创新动能澎湃,新兴产业风起云涌。

本次大会主论坛发起了一场关于《人工智能新基础设施》的圆桌讨论。
与会嘉宾有:

新物资本合伙人 申林

弘琪科创董事长 居琰

星凡科技CTO 谭铭玺

盛景嘉成董事总经理刘迪

本次论坛由盛景嘉成董事总经理刘迪主持,与会嘉宾围绕新一代人工智能基础设施,共同探讨了这一领域的技术发展、投资逻辑、商业空间、落地场景、发展瓶颈及2025年展望等问题,以下是本次论坛的核心观点:
1.AI基础设施范式转变:从传统IDC时代过渡到“智算中心”时代,新基础设施不仅是硬件升级,更是软硬件、数据、算法和应用场景深度融合的系统工程。

2.从训练到推理的重心转换:过去聚焦于大模型训练的大算力投入正在让位于高性价比、高并发、可大规模落地的推理场景。2025年,更多AI价值将通过垂直化、定制化的推理服务实现商业化。

3.数据价值凸显与合规运营:垂直行业应用需要高质量的私有、合规数据支撑。数据治理、数据资产化以及合成数据技术将成为激活行业应用的关键环节。

4.成本、性能与应用闭环:算力、存储、带宽成本需要在2025年前后显著下降,方能满足数百万级应用场景的需求。以“Cost、Performance、Market Fit”三者平衡为导向的商业模式将成主流。

5.产业生态协同与地方实践: 地方政府在投资“智算中心”时需放弃传统硬件思维,可以以五算(算力、算法、算训、算具、算用)为抓手,协同数据和场景资源,培育产业链上下游共同演进,避免资源闲置。

6.行业垂直大模型崛起:通用大模型热度趋于理性,2025年真正增长点在行业垂域大模型。创业者在垂直领域深耕行业know-how,将能打造更强的差异化与竞争力。

7.软硬件解耦与灵活部署:新基础设施将呈现云、边、端互联的分布式架构,以异构算力管理、Agent调度平台、智能资源分配等方式提高利用率,适配不同场景的动态需求。

8. 2025年前后,AI的发展将走向渐进式、务实式的持续落地过程:减少泡沫与盲目扩张,更注重产业升级和用户价值兑现。
以下是速记整理(有删减):

刘迪:我是来自盛景嘉成刘迪,大家下午好!

盛景嘉成成立于2011年,一直致力于创新投资,成立到现在累计投资规模超过130亿,通过母资金直投基金覆盖全球2500多家创新创业的企业,这里面也有240多家的公司成功在全球资本市场上登陆,达到了一个非常好的收益水平。
截止到目前为止我们投出很多优秀公司,包括像国联股份、惠通达,包括在人工智能领域一些布局,包括台上星凡科技,一会的深势科技,包括今天的主办方亿欧也是被投企业。
很高兴来到圆桌和大家共同探讨,我们在AI领域新的基础设施。第一个环节先有请我们三位嘉宾,简单介绍一下自己包括机构的情况。
申林:大家好,我是新物资本申林。新物资本其实我们是一个比较新的机构,21年开始成立,早期有孵化性的基金和中后期并购性的基金,主要方向在新材料新能源AI两个大方向,AI整个方向是我和另外合伙人主要来看的,AI方向上我们主要关注是三个大块领域。
一块是数据。AI整个起来之后,数据运营的问题、数据合成、数据处理问题很值得关注。我们也投了相关比如说类似隐私计算的公司和做数据运营的公司,现在主要看的数据资产,也是在多模态数据上,比如说音视频数据、合成数据等重点方向。
第二算力层面,投了响应科技公司。第三个层面主要在科技板块,科技和大模型这个板块主要针对一些垂直场景,多模态场景做了一些布局,这是新物资本基本的情况。
刘迪:虽然新物资本成立时间不长,但从刚才申总介绍、整个投资布局也能够感觉出来,新物资本在整个科技产业上面的投资,相对来说比较专注,是有自己独到经验的。

居琰:弘琪科创是多一家多元化的投资集团,旗下主要有三大业务板块,第一块电子板块,电子是一家上市公司弘琪电子,是中国柔性电子的第一股,2017年上市,去年开始除了柔性电子之外,成立了自己智算业务新板块-燧弘华创,重点投向智算。
一年多的时间我们已经成为国内比较领先的智算第三方服务商,从智算工厂到智算集群的租赁以及大规模的组网调优等方面,拥有一站式覆盖式的解决方案,与很多头部大公司全面地战略合作关系。

第二板块,智慧化园区和战略投资,我们与云创资本投了国内大概20多家移动互联网和智能化方向公司。

第三个板块物流科技板块,我们也是国内比较大物流散装货程的提供商,整个集团正在以弘琪电子为主牵引,全面引导整个公司向智能化、科技这样的综合集团转型,也愿意和各位人工智能上面应用和人工智能的企业进行全面地合作。

刘迪:感谢居总。我们也能感觉到弘琪在我们人工智能领域一个大的布局地包括广泛的视角。
谭铭玺:星凡科技是一家专注于AI算力基础设施的公司,聚焦于做面向大模型推理芯片。是希望在一个长文本多并发情况下是有很高优势的芯片。
在面对算力中心一个异构算力使用情况我们做了可以让用户能够方便的,在不同的场景下不同的模型下面,能够一键把模型从一个芯片放在另一个芯片去应用的适配的平台,同时也为大模型推理加速做了工作。

我们通过Agent技术让算力中心使用过程当中,不用面对学习烦杂硬件设施的参数性能,能够容易方便把异构算力用起来,这就是我们星凡做的事情。

刘迪:在座三位刚才大家也都分别介绍了,都是来自于产业方、投资方、信创公司,各位也都具备着非常多年产业从业经验。
第一个问题,想请大家从各自视角,谈一下今天论坛主题,新的基础设施究竟"新"在哪里?和传统上一代算力基础设施比起来有哪些不一样的地方,有哪些值得我们关注的点,我们从谭铭玺总先开始。

谭铭玺:对于"新"算力基础设施,算力基础设施面对一个大模型的训练场景或者推理场景,它的"新"在哪里?
从一个方向对于目的是没有什么新的,不管大模型、小模型一开始希望人工创造或者机器拥有智能,目的没有变。第二方法论,并没有改变,不管从以前小模型、小到机器模型小到深度模型,或者大模型,其实方法论就一个,如何从经验中学会智能,没有改变。
而改变是什么?现在我们要去实现我们这个目标的工具、手段变化了,以前算力不要这么大,现在我们算力变了。我们以前不会面对万卡集群,现在集群里面卡数目变多了,以前对芯片存储速度不高,现在要有HBM,要求芯片读取数据的速度要求更快。

以前也不需要芯片算力这么大,现在算力也很大,所以你会发现我们从以前到现在,真正改变一个新的东西是什么?其实是我们手段改变,我们目的没有改变,我们方法论其实没有改变,我们只是用更先进的技术,然后使我们的目的更接近,让我们想要完成的愿望变成更现实,这是在我看来一个新基础设施新的地方。

刘迪:总结下来跟上两头的东西没有变,中间是因为我们实现目的的过程,通过过程中间的方法改变导致我们现在基础设施发生一些变化。

我们看看居琰从产业资本角度有哪些可以跟我们分享的?

居琰:从以前传统基础设施,谈下一代智能基础设施,其实有几个改变还是非常彻底。

第一个,刚才说了规模越来越大,底层的技术逻辑没有变,最早我也是学神经构、神经网络。从本质到现在人工神经网络大逻辑没变。但是它的技术参数底层要求越来越大了;
第二个很彻底的变化,不管通算还是超算,频繁软硬之间的交互以及大规模组网调优实际上改变了,对于通算超算不可能有这么之间大规模数据、吞吐以及交互的需求。
通算的时候,它来自西部电价很便宜;对于智算成本,电价是微不足道。一个智算中心电价只占整体成本12%-15%之间,但是可能你第一年电价的成本反而被高昂带宽费用冲抵掉了。

第三个变化,是我们对于智算理解是狭隘的。大模型这轮热潮在逐渐降温,各个行业深入的AI应用,和深入的小模型以及行业垂域大模型在蓬勃发展起来,这时候需要我们对于智算基础设施有一个新的载体,和新的需要。
未来一定会是云、边、端一起相结合甚至到底层泛在无处不在的感知网络,和拾取信息这样一些智能的传感器其数据体才产生。从我理解上,基础设施一定不会狭隘的说是只是智算中心,未来中国要想决胜的时候,还是以场景为牵引,大量铺泛在基础设施才是我们未来的方向之路。

刘迪:感谢居总。

居总也谈到非常关键的点,现在这一波所谓基础设施的新,一方面是新在说底层这样一些技术的升级,另外一个也确实是对我们现有这些设施,可能也是需要有一个快速地升级改造这样的过程,包括刚才提到云边端的改造,甚至包括说我们通过这些数据高吞吐量网络传输设施的改造,是不是说现有5G也需要继续升级,是不是需要做专线的设计,这些都是可能需要我们社会各界各方齐力做的事情。

我们看一下申总从投资方角度怎么看待这个事情。

申林:我说两点,软硬件两方面,二位都在硬件包括结构层面说得比较细节了,第一个层面我觉得范式在变。
传统模型更多解决垂直场景的问题,形成平台化的能力,或者机会还没有那么的清楚,但是这次大模型的变化,包括无论预训练级别规模层面上,包括各行业渗透层面上,很有可能变成基础平台级别的变化。这个变化大家可以类比可能是IOS、安卓体系之余,芯片公司像高通这样的变化。

这个变化会带来非常大的逻辑是在于,端边云三个层面上会有很显著的软件定义硬件的逻辑,因为传统基础设施,只有大规模和大场景才能有集约化可能性,才能有来去做半导体芯片的这样的机会。
如果只是垂直场景芯片的话,现在看到只是在汽车这样的场景上,可能出现了芯片的机会,可能还有一些小场景但并不规模化。

第二个成本变,算力比较贵,但是推理场景从去年到今年,有上百位的降低。开富老师原来提到过说,原来PMF,现在TC-PMF,其中C就是cost,所以做端到端这个事情是所有做模型公司或者应用公司都需要考虑的问题,如果这个事情考虑不清楚,就是成本的问题,或者你要考虑选取什么架构,来实现模型的逻辑的话,其实是会很困难的。
所以我觉得这两个变成一个形成平台性的机会,第二个必须得有端到端降低算力成本的能力,我觉得才能在市场上会有竞争力,这是两个变化。

刘迪:感谢申总。

也是从软硬两端都给我们分享了新物资本这边独到的见解。

新物资本在整个AI基础设施(算力算法数据)这块,投数据做的布局,请教一下布局的原因,包括机会的识别点究竟在哪里?

申林:投数据,有两个大逻辑。第一个现在数据越来越不够了。到底数据从哪来,其实要从更私域地方来,私域到底怎么来要获取运营权的问题,幸好也有国内政策红利,会有一些数据产业新的机会。

这个部分是我重点看的一个重要的逻辑,政策红利叠加一些强需求。大家如果关注美国市场的话,有一家非常大的公司现在已经100多亿的美金的市值。最早就是标注的事,后来升级做数据合成然后最主要是针对于无人驾驶的市场,我觉得这是一个大逻辑。

另一个细分逻辑,是在中国其实在渗透各行各业,渗透各行各业最核心逻辑。无论看项目还是投项目,最核心要解决两个问题,第一个解决算力成本到底能不能比别人有优势。第二个你的模型效果比别人好不好。
大家都知道我们工程师水平还是不差的,但是拿不到数据也是白搭没有用,所以私有数据到底怎么合理化的应用,决定了模型质量能做到多高,我觉得这是基础设施。
而且我们现在看到几个场景,无人驾驶、语音通话的场景,类似于文生图、文生视频的场景,现在瓶颈已经卡在私有数据获取上了。这其实是我们看数据最重要两个大逻辑。
刘迪:像整个产业应用发展,大家普遍感觉算力贵,但是刚才你也提到了,不可能现在100万token零点几美元这样的水平,至少国内现在能够看到一些垂类的场景的数据也在逐步的开放。是不是意味着说,我们站在岁末年终说这个话,在2025年会有产业应用爆发级的机会?
申林:对,体感还比较明显,包括看的一些被投的标地,和我们说的算力数据的企业市场的情况,我个人觉得明年会有几个变化。

第一个走向了刚才大家都提到从训练市场走向推理市场,本质上也是场景成立了。
第二个层面其实有些大的垂直应用,有些在模型层面上,拿到一些私有数据,已经有突破了。
举个例子比如说现在各个政府推动无人驾驶场景,运营商推动了通话场景,通话机器人的场景,包括刚才提到安全的场景,其实在细分市场都突破了。所以我个人还是比较乐观明年有很多细分场景,包括营销。营销很多数据是在线化的,所以也看到很多突破,还是比较乐观。

刘迪:从投资人视角来看,整个基础设施投资不管你是投数据还是投算力,都还是比较烧钱,投资回报周期还比较长,像海外微软、META,他们每年在这预算都是百亿美金级别,在国内除了大厂做早期的布局,我不知道对于在座这些可能的大多数创业者为主,整个创业的机会或者是这一波整个大浪潮的机会在哪?您从投资人角度给大家一点建议或者意见吗?

申林:深入到细节都是有机会的,第一个大机会大家比较认同是场景化机会。场景化机会可能和各位资源禀赋擅长的东西要相关。
我个人觉得应用模型端,要找和客户的真实需求挂钩比较近的。比如说我们看过一家公司做的非常小众的细分赛道,做分享。日本漫画在中国的外包或者说印度的外包,给它工具化了,很细分。但是业务流、现金流、壁垒很高,因为它不光做底座模型,它也做的很多垂直模型,这些都是行业knowhow。

其实像这样的案例,我们发现越来越多会出现。前两年其实机会高不可攀,现在使用成本也好,认知成本也好在降低。
所以从业者,我感觉找到了2013、2014年移动互联网那波应用爆发前期,行业创业者出现一些机会。
算力端简单讲其实还是要和需求结合做端到端,包括星凡提到推理,推理场景核心就是成本,如果做常规版,还是文生视频、文生图每一个场景都是大场景,只要做好一个细分场景,你的业务逻辑就成立。
中间刚刚数据讲过了,数据这个事情反而是中国很多创业者,我觉得可能更容易拿到,因为中国数据是私有化,只要能做到垂直比较好的应用,我觉得数据拿到运营权,来去训练你更好的模型是有机会的。

刘迪:感谢申总。

请问一下居总,因为居总在行业里面从业时间比较久了,应该是经历了我们说从IDC时代,一直到现在智算中心整个过程。那么,从您自己体感来说的话,我们最早IDC机房投入,到现在智算中心,大面上还是政府大量资金在往里面砸,不知道从您体感来说从背后投资逻辑,包括大家对这个事情预期会不会有哪些角度的变化或者方向上的转变?

居琰:其实从去年开始,智算中心来了一波新的热潮,实际上我们是国内在投IDC的时候有过教训,原则上IDC大量依赖电力,我跑的城市比较多,基本上各地都会有大大小小的IDC,但是准确说一句,荒废掉的,入不付出IDC占了绝大多数。

大概11年开始新一波的IDC,像江苏浙江各地每个市标配IDC,很不幸连风火水电都没上,大量的闲置空置,这次AI兴起的时候大家觉得IDC新的春天来了,各地普遍呼唤说我要做智算。

但实际上,有过一些应用之后,各地又在反复问,智算和IDC有什么差别?

而且智算成本大概是显著太高了,高的离谱,我曾经说过IDC如果三个亿,把三个亿IDC智算填满我大概花20亿,20亿以后能给你带来多大的收入,只是说我在当地成立公司租赁还好,如果不成立公司实际上很麻烦。
很多时候他们也在问我为什么要做, 我回答是,如果说一个城市想说你自己还要做新质生产力,还要发展新的产业方向我觉得还是要投AIDC。但是对AIDC的定义不能这么狭隘,刚刚申总讲的如果把AIDC等同于IDC就完蛋了。
从我一定程度上看AIDC,我对一般人会说,三算,我给它补充为五算。

我说应该是算力、算法、算训、算具、算用,几个是一体抓。
我们中国讲场景牵引,实际上算运用关键和根本,只有把智算和当地产业升级能够有效结合起来,智算才能真正有价值,政府在智算有价值的过程当中,应该有所作为。
很明显,智算、算力你有了,算用你可能会有这部分,但是算法、算具、算训你没有,包括我们说语料公司、标注公司一定程度它在我们整个智算生态很关键,没有这样的生态,你那个地方上是没有办法构成完整智算产业和智算生态。
这种情况变迁下,IDC你可以简单是说上一代基础设施,但是IDC是下一代的基础设施,你要让你的IDC发挥最大作用,千万不要把它当作传统的基础设施,应该有智能化眼光,大数据眼光更多来看。
比如说我们如果现在做自己数据交易,单纯说把数据复制,但是你的数据都是不可信,那没有任何意义。所以需要更多用一揽子来看IDC或者看新型智算中心,到底价值何在?在座创业者也一样,在这里面寻找自己的创业机会,而不是用传统办法,而且最重要是,现在是技术和商业模式,以及场景并重的时代。

也看到AI公司为什么大幅度亏损本质原因是不会管项目,因为它自己伸手进去,伸手一定是亏损,所以一定程度上AI时代你的商业模式以及自己的进入项目的模式,都要改变。

刘迪:我觉得居总提了非常好的建议,现在时间点不管作为创业者也好,作为地方政府也好,一定要把自己在产业链里面的深位包括未来在产业链从事哪些事情,不管是传统意义上三算还是五算,把自己定位找到,这个事情很重要的。

就着这个事的话,因为刚好今天上午是火山引擎开会他们公布豆包的数据,我看到很震惊,每天4万亿的token在那烧着,大概盘了一下几十万张卡,以字节资金储备来讲这个不是一个事情,如果我们把它类比成超算中心的话,那是不是未来也是会成为我们在现有地域级超算之外一个新的竞争力?
就像当年做云计算的时候,大家本来以为运营商牵头最后跑出来四朵云、五朵云也好,和运营商没什么关系。
AIGC这个时代的话,也可能会有一些新的巨头,比如说像海外微软、META也好,马斯克也好,你会发现他们也是在进行一个大的全产业链全站式布局,这个事情在国内发展态势会是什么样的?

居琰:我觉得未来会是综合竞争态势,因为我们和很多头部的大模型公司合作,我们是它最大的智算产地供应商。

现在情形和您说豆包字节一样,明显已经有了狂奔猛进,但是有的企业明显在开始掉队了。

在这方面,这一场竞赛没有大规模资金的支持很难脱颖而出。会不会像云一样的?原来是有运营商,结果跑出来几套云,我个人第一观点不太可能。因为你再怎么卷,你是后来者,除非再有颠覆式的技术创新,像通用大模型颠覆式创新出来,有可能你弄一个豆包,像以字节实力,它去投智算它自己感觉到有点吃力。
马斯克10万卡,我们现在也正在努力为一些头部大模型公司,没敢说10万卡,先来5万卡试试,但是5万卡大概投六七十个亿,还要面临很大不确定性,买了这么多海外卡,有可能美国就制裁你了。

这是第一个不太可能出现的原因,因为已经变成有钱人的游戏了,资本集中的游戏了。

第二点,在细分大的智算,大规模投资情况下,面向场景应用,行业应用、垂直应用,反而给我们众多企业的生长的时候,带来了新的方向。
但是在这个生长方向过程当中,不再以以前粗放生长方式,不以采取有奶就是娘的方式,以前初创的时候不管移动互联网、软件初创都是有奶就是娘,反正抓到客户客户需要什么就定制什么,现在反而需要在这上面耐心下来认真看,在产业链条当中能找到切实细分的。
一定程度上,你的角度越垂直,切入更深,成功机会更大。
不要把垂域大模型 自己想的功能特别强大,实际上一定程度上一旦做到垂直了,一旦程度上我们IT人,应该让位给行业的人,人家理解钢铁比你360理解更深入,因为人家会是主导者。

所以在这个里面,应该是一个千行百业深入的机会,也给大家带来了更大的腾飞的机会。

刘迪:其实还是一个通用大模型和行业垂类大模型的逻辑。最后居总介绍的时候,也谈到我们整个弘琪其实在我们产业链各个环节上面,有上市公司、有投资可能还有一些产业链其他布局,未来的话我不知道作为弘琪科创来说短中长期会在我们基础设施哪些方面上,进行一些侧重的投入,或者说我们整个发展方向,大概会是什么样?

居琰:我们在这上面有过自己的思考,一定程度上我们算力的板块,我跟他们说你不是服务器的制造工厂,你是智算集群的提供商,一个智算全站解决方案的提供商,我们会坚定不移进一步扩大智算的规模,现在手上算力大概4万P。

但资本超出想象的贵,现在不确定因素也大。
第二我们会坚定关注国产化,我们智算不是简单的服务器或者是一个云边端,是一个整体的生态的打造,我们会主动采用国产芯片,因为我们也投了芯片几家独角兽企业,我们会和CPU和各项服务的企业,来进行整合。整合目的是打造一个完整的国产智算的生态。

第三个我们特别关注,在垂直细分领域一些软硬结合的企业,包括具身机器人,包括一些行业应用垂域的机器人,包括无人驾驶方面的这些公司。现在也有一些目的目标投这些公司。
最后一个实际上还是发挥我们自己的综合业务集团优势,更多想法是自己冲在前面,搭建一个平台。我们在各地建新型智算的园区,智算园区里面最重要想通过场景+资本+我们技术、模式几方的叠加,使得我们真正的智算这方面成为我们中国发展新质生产力一个最重要的引擎。我们大概会做这四方面的。
刘迪:我们也是欢迎台下收看我们直播创业者们,能够和我们居总产生联系,也是祝愿大家能够在未来国内AI生态里面找到自己的定位。

最后和星凡谭铭玺总我们请教一下,因为作为一个初创公司,我觉得着我想知道的是星凡怎么样去选择推理赛道,因为大家那个时间点都还是关注更多一个预训练的情况,星凡怎么样在Day1开始把自己关注的角度放在推理这块,请谭铭玺介绍一下。

谭铭玺:我先从大家比较了解的事情说,现在大模型训练阶段,我们说scaling law它要越来越失效或者不起作用,或者消失怎么样了。其实因为scaling law决定我到底要不要继续训练大模型,之所以星凡没有走到训练这个路,而是做推理。
第一个,一开始我加入星凡的时候,我和我们老板聊过,我们不管从几年前,小的一个神经网络训练,到现在一个大的神经网络或者一个大模型训练,整个过程其实就在重复16世纪经验主义的一条路。
什么意思?刚才我讲的小模型、大模型只在做一个事情,如何从经验中,学习知识,因为16世纪的时候提出一个观点,人如何学到知识,它说ok,靠经验了。
人的大脑开是空空如也什么都没有,通过你的经验你学到一点知识,比如说你在加拿大看到月亮很大,维度的原因,比成都月亮大一些圆一些,如果一个人你在成都看到一个月亮,它会小一点,其实这两个人而言经验告诉他们,他们都看到一个东西叫做月亮,但是问题是这种经验如何让你产生有共性的知识,这是经验主义面对的问题。

按理说,只是在一个场景下看到一个更大的月亮,在另一个场景下看到更小一个月亮,他们为什么是一个月亮呢?这个共性知识如何产生起来?
这是在经验主义里面它对知识论里面很难解释的问题,到后面康德提出的观念,就是说有些能力人是不可能通过学习得到的,就像我们现在觉得大模型要有推理能力,康德说什么,他说有些能力不是通过学习能得到的。

比如说什么能力呢?一个对因果分析的能力,与生俱来,对多与少认识的能力,分别单数多数的能力与生俱来,对空间、时间的感知能力与生俱来,这不是你可以学到的,你因果分析推理和0-1过程不可能学到,是那些有的。
但是1-2、2-3你可以通过后天你对经验的丰富,你的学习、你的总结,你可以得到更高的推理能力,之所以人生下来有这样的能力,我们在加拿大看到的月亮,然后我们坐的车,飞机去到成都,看到另一个月亮,经验主义告诉你我看到月亮、坐的车坐的飞机看到月亮,他们月亮不一样,因为你有与生俱来的推理能力对因果的分析能力,所以你知道这两个月亮其实是一样的。
他们之所以产生象限的差别是因为距离不一样。这是康德一个看法。我内心知道康德是对的。
但是回到大模型、小模型训练来说,在小模型、大模型我们给它喂的数据就是它的经验,你发现我们现在模型遇到问题就是比如说我共性知识如何产生,我在有限经验的数据集训练的模型,我如何产生共性的知识,放到大模型、小模型就是我如何能够有举一反三能力,专业讲泛化能力在哪?解决很多年没有解决的问题,而小模型大模型的差别是什么?小模型你的数据量比较小,你的泛化能力差,大模型解决方法是什么?
我增加我的数据量,从经验数据角度来讲,你增加你的经验你必然增加的认知,增加你的智能,那么在大模型而言,我增加我的数据量,我必然增加我的能力,就像以前我可能只有小模型的时候,我只有加拿大的月亮,还有一个成都的月亮,数据级很小。
过段时间你拍一个月亮,模型觉得不那么是月亮,而大模型方式是什么?我把各个地方月亮照片拍好,哪怕背面的都拍好,把这些数据都喂给大模型,因为我们让网络有智能的方式是通过经验是学习,那么它的问题是我需要不断地扩充它的经验,才能够扩充知识能力,而扩充经验我需要大模型去记住各种各样不同的case例子案例,我必然需要大模型它的能力、自由度越来越高,我才能记住更多一些经验,让它的能力达到一个市场能力提升。

这是我们现在做的事情,而这样的事情产生的效果是,我们的数据越来越小,我们可用的数据越来越少,你会看到,ok,好像我们再往下走,数据没有了,我如何通过扩充经验的方式能够使我大模型能力提升机这条路似乎走不下去,因为数据没有了。

我们培训结束了,因为其实是没有数据,但这并不是说是错误的,因为只要你走的经验主义这条路,这个规律已经在那放着的。

像万有引力,世界上没有行星,你是感知不到万有引力,但是万有引力在那里。
一旦有行星了,万有引力就有了,你就感觉到了,所以如果现在有数据了,发现scaling law还是可以用的,增加数据依然可以增加智能,但是这条路是不是一个通往我们真正能达到人类智能的路,或许康德那条路更正确,我很早加入星凡的时候就想这个问题,可能现在我们AGI路的发展,要达到人类的水平,可能不是一条完美的解决方案,但是它是一条可行的解决方案,它是可以产生效果的方案,所以一开始我们星凡内部讨论,我们可能做训练的天花板我们可以看到,至少我个人认为从我对认知论理解来看,它可能不是一个可以长期持续的路,就算是现在o1出来了,你发现o1本质并没有改变,以前我们训练数据训练模型,是给出一个输入,得到一个结果。
o1是出一条数据,把结果分成12345,只是把我经验做的更详细更详尽,本质上并没有超出经验获得知识这条路没有超出的,所以天花板或者说它的整个尽头从一开始我个人感觉,可能不是应该我们要做的事情,因为投入太大。
而且从我认知论来看,要把精力放在推理阶段。这个时期,星凡all in在推理阶段,就是因为整个大模型能力在上升,会越来越慢,因为数据没有了,有些人会说没有文本数据,还有音频或者是图像数据,但其实我们要知道不管音频图像,数据里面内容和文本没有太大差异。
可能通过图像、音频的数据扩展大模型的,在音频、图像那方面的能力,但是你没法提供让它智力、智能再提升,这是非常困难的事情。

当一个大模型能力变缓的时候,我们会想到那么越来越多的成熟把大模型行业结合的,行业大模型会越来越多,他们对推理基础设施的需求、推理算力会越来越大。

我们去年开始布局,后面我们会相信是我们公司发展是有前途,因为它满足市场发展规律,而且推理市场会越来越大,所以这个可能是回答了刘总一些问题。

刘迪:好的。

谭铭玺总提到事情也是作为投资人看到的情况,不管今天看到火山发的新的豆包的多模态的功能,还是说前几天OpenAI春晚,整体你会感觉远不如第一眼看到ChatGPT的反应,甚至说不如年初见到Sora震撼,大模型的整体逻辑来看,现在数据量不断变少,以至于针对于不同行业垂类的方向不断地发展。

可能真正你去做预训练这个事是一个规模不清晰的事,不是说否定这个事,而是在真正垂直落地方向上的时候,不是所有人都可以烧得起这么大的资金的。

未来确实是我们自己判断说,会是一个从训练侧向推理侧这样转变的过程,刚才台上各位嘉宾也都分别针对于现在新的基础设施提到自己的观点,我们也是觉得希望各位的创业者有空的时候,去多想想自身在产业链当中的定位。

最后希望我们每个嘉宾,用一句话去对2025年,整个产业发展包括我们整个新基础设施发展做一个展望。

申林:我是前年大前年都很悲观,因为我做计算机出身的,虽然我当时知道有些模型突破,但是我觉得今年我相对乐观,一句话“如果大家对宏观一些无论形式还是方向不是那么乐观的,还是不是那么明晰的时候,我建议大家往微观多看一下,然后多往行业、多往最基层应用方向来看,可能会发现更多的空间”,2025年我整个感觉算力成本会进一步显著下降,而且能达到很多创业者负担起的状态,特别是在推理场景上。

第二因为算力下降,会催生越来越多的除了大厂之外垂直场景应用出来,我也特别看好这一点。

居琰:关于2025年实际上我有一个很朴素的观点,明年肯定会是一个AI再次迸发的一年,但不会是眼前一亮,完全是颠覆性。对于明年基本判断,All in AI,现在经济情况不好,我们看到不景气,本质上是产业转型升级,你做传统任何一个行业,说实话都能卷死你。唯一的路我觉得只有AI。

谭铭玺:从技术角度来看我个人看到我们差距和国际相比,确实全方位都很落后,这不是悲观,这是事实。我希望更多公司能够做AI,但是如果把AI做好的话,其实需要有坚定信仰信念的人还有谦虚的人,欢迎加入我们,持续的一起努力,我觉得才可能把AI做好。

刘迪:好的,谢谢。

我们今天论坛就到这结束,我们也是期望能够看到更多的产业应用不断发展,我们希望在下一个论坛上面看到其他嘉宾给我们分享精彩的观点,我们今天论坛就到这,谢谢各位。

END

亿欧网
科技与产业创新服务平台
 最新文章