首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

烧钱结束？多家国产大模型公司放弃预训练，技术转向不丢人！

科技 2024-10-14 17:54 北京

前两天，36氪旗下的一个公众号《智能涌现》爆出了一个大消息，整个国产AI圈儿都不淡定了。

据《智能涌现》了解，被称为“AI六小虎”的6家中国大模型独角兽（智谱、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰）中，已经有两家逐步放弃预训练模型，缩减了预训练算法团队人数，业务重心转向AI应用。

当时，《智能涌现》并没有在文章中说明到底是哪两家要放弃预训练模型。后来，有媒体跟进，猜测很可能是百川智能和零一万物。理由也很简单，其他四家最近动作频频，但是百川智能和零一万物在预训练大模型方面没啥更新。

智谱与MiniMax发布了视频模型，月之暗面发布大模型版本更新，阶跃星辰发布了万亿参数大模型。所以，人们怀疑百川智能和零一万物，就是媒体报道的已停止预训练的两家企业。

很快，这两家企业就发声否认了这件事儿。其中，零一万物创始人李开复10月11日晚上在朋友圈发文说，零一万物一直在做预训练，去年和今年发布的Yi-34B、Yi-Large、Yi-Coder、Yi- VL、Yi-Vision都是发布时全球第一梯队，国内领先的预训练模型。

而且零一万物的新预训练模型也即将推出。

其实，在此之前百度也有类似的传闻。9月的时候，有个帖子火了：“百度大概率将放弃通用基础大模型研发，（又是起了个大早赶了个晚集?）李彦宏最近和内部明晰了主要做应用的战略，百度在模型层实在卷不动了。”

随后，百度文心一言的市场部负责人张全文在朋友圈辟谣，“所谓‘放弃通用大模型研发’纯属谣言！文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。”

行业不会空穴来风。如果只是一个企业，一个消息，那可能就是造谣。但是涉及三家企业，且集中在九月和十月，基本可以判定，大模型这个行业已经走到了一个转折点——所有国产大模型玩家都要重新审视公司战略问题了——要AI大模型，还是要AI应用。

第一，预训练大模型成本太高，现在看已经有人开始烧不动钱了，后续还会有人掉队。

很早之前我就说过，预训练大模型投入成本太高，且即便做出来，也可能因为别人开源导致没有任何竞争力，无法商业化，最终一分钱都回不来。

以GPT-4为例，该模型的训练需要一万块英伟达A100芯片跑上11个月。假设每块A100的成本为10000美元（价格因供应商和购买数量而异），那么一万块A100的总成本约为1亿美元——

那就是7个多亿的人民币。

所以，投资人朱啸虎说过，中国不必在通用人工智能（AGI）上大肆投入资金，因为美国已经为我们试错探索了前行的道路，中国只需在其成功验证后跟进即可。

百度作为大厂确实资金储备方面要强不少。截至2024年6月30日，百度持有的现金、现金等价物、限制性现金和短期投资总值1620亿元。但是，并不是说这一千六百多亿都能完全投入AI，也不是说这些钱都能用。

第二，放弃预训练大模型，实际上就失去了这波AI大赛的主动权。

这么多AI企业为什么要疯狂追预训练大模型这个风口？因为预训练大模型是大模型应用的基础，这是AI核心中的核心，只有把这个核心做好，才能在竞争中拥有真正的话语权。

但是前面我说了，这个预训练大模型虽然是王炸，但是投入成本太高，所以对于很多初创企业来说，更符合商业利益的做法，其实是追AI应用。

在这点上，其实百度李彦宏说过很多次，甚至还在百度世界2023上发表了一篇题为《手把手教你做AI原生应用》的主题演讲。

第三，国外也有企业放弃预训练大模型，未来大模型玩家只有3-5家。

2024年8月，硅谷的明星AI企业、角色扮演类应用的典范Character.AI，宣布放弃预训练，转向与第三方模型合作。他们在官方博客中给出的理由是：这使我们能够投入更多资源进行后训练，并为不断增长的用户群体创造新的产品体验。

国产AI大模型现在其实也就是两条路。第一，继续压住预训练大模型，尤其是紧紧跟随OpenAI o1新模型，进行更有确定性的开发。第二条路，就是放弃预训练，转而AI应用落地，结合行业场景，实现商业闭环。

其实，这样的路径分野非常好。因为只有这样，才能真正实现百花齐放。在岛主看来，放弃预训练不丢人，真正丢人的是忽视自身实际情况，押宝押错了。

http://mp.weixin.qq.com/s?__biz=Mzg5Njc3MDAwMQ==&mid=2247484399&idx=1&sn=4a2841f1c056f6d3d90a263d2488f5a3

数字进化岛

洞察科技产业，透视全球真相。

最新文章

百度Q3净利润增长17%超预期，为啥美股港股双双下跌？

强烈建议麦琳和李行亮锁死，谁也别出来祸害别人

胖东来和钟睒睒，请你们大胆说下去

AI让人类去死，是产生了自我意识？别太天真了

不要被钟睒睒给骗了

何同学早就该翻车了

华为云双11强调价值战：华为云是打不起价格战吗？

惊！腾讯混元大模型技术负责人刘威离职，离职潮席卷“大厂”？

OpenAI o1模型炸场两个月后，Kimi对标发布国产最强新模型

刚刚！腾讯低调推出AI搜索产品ima，最大的亮点不是能搜公众号

奉劝百度，不要企图用非共识言论惊爆市场

李开复对AI为何频频指点江山？

美国OpenAI慢了！国产大模型正在海外大杀四方

突发！Kimi创始人被多家前投资方申请仲裁，国产大模型不被资本看好了？

特朗普上台，中美AI走进大爆发前夜

全网老公崩溃？八个瑞士卷怎么分？我问了问国产AI TOP10：这个AI一个都不给老婆分

“男老师造假，毁了女学生，姜萍也是受害者”

中美大模型如何追赶？李开复：缩小中美大模型差距其实很难

禁令落地！刚刚，美国宣布2025年起限制对华AI投资，香港和澳门也不例外

雷军七天骂翻全网？那个让雷军不得不回应的AI配音，究竟是怎么做出来的？

开源世界天塌了！因为美国政府制裁，Linux 内核就“清洗”了11名俄罗斯开发者

美国AI像人一样用电脑，中国AI像人一样用手机：是划时代还是伪需求？

一个美国AI大模型，让14岁男孩决定去死

重大转折！融资千万的AI公司被OPPO收购，95后创始人携核心团队集体入职

最新！美国限制对中国AI投资的规定，将在一周内发布：想要杀死国产大模型？

京东这次翻车，和百度如出一辙

百度为啥不做Sora类的视频生成？李彦宏：10年、20年都可能难以商业化应用

李开复谈中美大模型差距：很多美国朋友都认为中国会远远落后

惊了！损失超千万美元？字节大模型整个GPU集群被实习生病毒攻击，两个月的训练结果都是错的

封死最后合规渠道！微软Azure OpenAI突然终止中国个人服务，国内套壳大模型无路可走？

太蠢了！四川2.15万亿拆迁项目竟然是用 AI 生成的

见证历史！国产大模型首次在公开榜单上超过GPT-4o

百度网盘安全漏洞！女用户隐私照片被泄露，陌生男子：比我还色

烧钱结束？多家国产大模型公司放弃预训练，技术转向不丢人！

一文读懂国庆后股市行情和操作指南

官方确定三只羊录音是 AI 合成，人们为啥不相信？

估值万亿、清除异己！美国最强AI公司成功集权，OpenAI CEO奥特曼成最大赢家

会说中文，讨好中国？预告4个月后，ChatGPT终于上线了语音功能

数字铁幕！美国禁止联网汽车使用中国研发软件，《纽约时报》都看不下去了

ChatGPT 之父罕见发长文说不要怕AI，为什么国内网友反而更害怕了？

当AI学会了自我批评

蚂蚁吞大象？高通被爆将收购英特尔，或成史上最大科技并购

Kimi创始人杨植麟说出行业真相：全球人类数据都已经被AI学完了……

百度AI，骑虎难下？

阿里云新加坡大火烧了30小时，20年后也不能恢复？

突发！阿里云盘 bug 能看别人隐私照片，甚至不知道事故发生了多久…

打脸！美国OpenAI发布最新模型，李彦宏的十年预判现在就错了？

还有15项异常！阿里云电池爆炸机房着火，为啥导致字节跳动服务严重中断？

再升级！美国要求先进AI公司报告模型训练情况：防止中国使用美国最先进技术

阿里云新加坡节点突发火灾，客户业务为什么没有自动迁移？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉