为什么发布ChatGPT后,国内很快就如雨后春笋,是在之前就已经开始训练了吗?

乐活   科技   2024-03-01 21:15   英国  
问题:从A到B有很多条路线,但是只有有限的几条是行得通的,但是必须得走过了之后才知道到底行不行得通,请问你该怎么办?
解法1: 先不试,等其他的人去试,等他们行得通了我再踩油门跟上去。
解法2:都不试?那我先试。
OpenAI做的就是解法2的事情,没什么人愿意花几百万美元就训练一次,可能什么结果都出不了,几百万就是扔进水里都能响一阵子,但是训练完了效果很垃圾,那真的是纯纯浪费电。但巧的是,它就是搞出来了,不仅搞出来了,还雪藏了一年的GPT4。
这样的效果就是先发布了ChatGPT,让所有人都知道了这条技术路线,然后前仆后继的去做大模型,瞬间有了全世界大模型到处盛开的局面,然后发布了GPT4,在那个时间段内遥遥领先。
你要想丰收,得先种下种子。
即使是有了现成的技术路线,那些做得不错的也都是有丰富的储备。
比如百度阿里,他们本身就积累深厚,自己搞出来的大模型都很有特色。
最差劲是那些啥都没有的,要么直接微调别人的开源大模型,要么就是接OpenAI的API,美其名曰自研大模型。


平凡的平凡
偶然所做。
 最新文章