为什么国内首发的大模型,反而不如新来的KIMI、豆包?

科技   2024-09-10 17:07   安徽  

点击上方蓝色字「大全Prompter」>右上角...>设为星标

大家好,我是大全,90 后宝爸,BAT 大厂架构师,专注于输出 AI 入门 + AI 提示词内容,全国最大 AI 俱乐部教练,关注我一起进步。

最近,国内很多大厂都推出了自己的大模型,比如百度的ERNIE和讯飞的模型,

但这些“首发”的模型表现不如人意,反而是一些新晋选手,比如KIMI、豆包等初创公司的模型更受欢迎。

到底是怎么回事?大全来和大家聊聊其中的几个原因。

1. 数据质量:大厂“多”,不一定“好”

大厂有海量数据资源,看起来优势明显,但这些数据不全是优质的。

要想训练出好的大模型,需要是“精心挑选和处理”过的数据,而不是随便堆一堆数据。

大厂的资源是多,但数据处理这块,未必比得上那些专注于小而精的初创公司。

KIMI和豆包的团队在数据选择上就特别的用心,靠着优质数据,模型效果自然会更好。

2. 算力:有钱有设备,但不一定效率高

大厂硬件资源确实强,动不动就是一堆GPU和TPU,训练速度快。

但资源多并不代表效率高,分布式训练、算法优化这些并不是靠硬件堆就行。

反而是初创公司在资源紧张的情况下,往往会用更聪明的方法提升效率,最大化利用每一分算力。

像KIMI和豆包团队,小而精,更懂得资源的高效使用。

3. 算法策略:大厂急着上线,初创公司细水长流

大厂急着“抢跑”,就像百度,最早版本的ERNIE是基于BERT的架构改的,后来ChatGPT火了,又得重新来。

这样的策略短时间内能跟上节奏,但少了很多创新优化。

KIMI等初创公司不着急,他们在长文本处理上做了很多优化,算法上更精细,效果自然比那些追求“先出活”的大厂好。

4. 团队文化:大厂复杂,初创公司一条心

大厂内部复杂,部门多、利益纠葛多,研发效率往往打折扣。而初创公司更简单直接,团队目标一致,沟通顺畅,执行力更强。

KIMI和豆包的团队靠这种“心往一处想,劲往一处使”的精神,能更快更好的迭代优化模型,打磨出更优的产品。

所以,说到底,大模型的竞争不只是比资源和钱,更是比谁更懂得如何用好这些资源。

大厂有它们的优势,但也有不少掣肘,初创公司凭着“专注、敏捷、高效”风格,在这场比赛中脱颖而出。

对啦,大全之前写了一篇阅读达6万的 kimi 详细使用教程,大家也可以看看:

AI工具:别再只会对话聊天,9 个 Kimi 高阶用法,80%的人都不知道!

AI 提示词:Kimi 一键生成万字长文?90%的人都没用过!

老规矩,学废了点个赞或在看呀~

订阅下方公众号,回复 免费拉你进 AI 微信学习群,领取价值 999 的神秘 AI 大礼包
大家好,我是大全,90 后宝爸,211 本科法学毕业,大一开始自学编程,北漂 10 年,从小白到架构师,全国最大 AI 俱乐部万人航海教练。
当下是一名 AI 领域创业者,借势 AI 90 天击穿公域,全网涨粉 5万+,总阅读 500万+。
大全的愿景是成为 AI 的布道者,带领 10 万小白入门 AI,让更多的人在大全这里掌握 AI (提示词)的能力,在已经到来的 AI 时代不掉队,不被 AI 淘汰。

扫码免费加入我的 AI 星球,邀请了很多大佬
会分享很多 AI 学习干货,可领价值 1999 AI 学习福利


我就知道你“在看”

大全Prompter
AI 提示词 Prompt、Sora AI视频、Suno AI音乐 领域|5 万 AI 星球读者(合伙人) ,带小白入门 AI|AI 副业变现 | 爱好:读书,拳击,拉丁,厨艺,绘画,户外|
 最新文章