这是薛老板求职系列的第704篇文章
截止到2024年9月,网信办备案AI大模型数量已达197个,这些大模型哪个最有前景?相信是很多人的疑惑。
百度
百度有先发优势。文心一言是国内第一个正式发布的中文大模型,目前仅 C 端就已经有上百万的 DAU。目前已经达到 GPT-3.5 和 GPT-4之间的水平,部分中文能力已经达到 GPT-4。 百度顶层重视程度高。在文心一言最关键的一段时间,Robin 每天都要听取文心一言团队的汇报。GPU 是唯一需要 Robin 亲自调度的计算资源。 百度有很多文本数据积累。在移动互联网之前,百度是中文互联网最大的公开数据汇聚地。移动互联网的数据大部分是烟囱化的,很多甚至是私有的。百度的数据团队也非常强,数据采集、数据清洗都是相当专业的。
字节
字节有落地场景。比如现在做视频生成的很多,字节暂时并没有像 Runway、Pika那样做端到端的生成,而是走了更务实的路线,把 AI 能力放到剪映里面,使用户更容易创作短视频,但是字节视频生成的落地场景是一点都不缺的。
字节有最多的多模态中文私有数据。高质量数据在大模型训练中是非常关键的。中文高质量的公开数据本来就不多,现在基本上已经被爬干净了,2026年高质量语库即将耗尽。大模型的下一站肯定是多模态,字节有最多的多模态数据。 字节有很多GPU资源。早在几年前,字节就开始做大规模 GPU 集群,积累了很多 GPU 资源,今年初 GPU 荒的时候,火山云靠着屯的 GPU 卡一跃成为国内第二大 GPU 云服务商。字节几年前就开始搞大规模RoCE网络来做 GPU 集群互联了,能搞定这个的全球就没有几家,微软是规模最大的,今年刚发了 paper。