01. 外界对大模型有相当多的误解。每个新模型发布,都要和GPT40做比较,在榜单上分数差不多、甚至单项超过,但这并不表明和最先进的模型就没有差距了。
02. 模型之间的差距是多维的,不仅有能力差距,还有成本、推理速度的差距。有些模型虽能达到同样效果,但成本更高、推理速度更慢,还是不如先进模型。
03. 真正衡量大模型能力的是,在具体应用场景中,是否满足了用户需求、有没有产生价值的增益。
04. 大模型的天花板很高,今天做到的和理想状况差得还非常远,所以模型要不断快速迭代、更新和升级。要能几年、十几年如一日地投入,不断满足用户需求,降本增效,模型之间的差距就会越来越大。
05. 在一个完全竞争的市场环境中,不要觉得领先 12~18 个月是个很短的时间,只要能永远领先竞争对手 6 个月,你就赢了。
06. 模型除了能力效果之外,还要看效率。效率上开源模型是不行的,闭源模型准确讲应该叫商业模型,有无数用户分摊研发成本、分摊推理的机器资源和 GPU,GPU的使用效率是最高的。
07. 以前用开源的 Linux,已经有了电脑,所以用 Linux 是免费的,成本低;但这在大模型时代不成立,大模型推理是很贵的,开源模型不会送算力,还得自己买设备,解决不了算力高效利用的问题。
08. 大模型应用的发展阶段,一开始是 Copilot,然后是 Agent 智能体,最主要的是它有了自主性,能自主使用工具、反思、自我进化。这种自动化程度再发展,就会变成 AIWorker,能够独立完成各方面的工作。
09. 现在智能体的热度开始上来了,但到今天为止,智能体还不是共识,像百度这样把智能体作为大模型最重要的战略和发展方向的公司并不多。
10. 为什么强调智能体?因为智能体的门槛确实很低。很多人不知道怎么把大模型变成应用,而智能体是一种非常直接、高效、简单的方式,在模型之上构建智能体相当方便。
Anthropic “第八位联合创始人”:Siri 这类产品不是创业公司机会,AI 在这些电商和社交领域有数十亿美元市场。