这两天,OpenAI的「草莓」Strawberry o1系列模型突然上线了!我们知道,逻辑推理对于以往的大模型LLM来说,是很难跨越的高山。你经常可以得到貌似正确却有很多逻辑错误的回答,这让AI使用者头疼不已。
但这一次,o1模型展现出的解决复杂逻辑难题的能力让人惊讶。在复杂推理、数学和代码问题上,它提升到了全新高度,可以说非常接近真正的通用推理能力。
在一系列基准测试中,o1相比GPT-4o再次有了巨大提升:在竞赛编程问题(Codeforces)中排名前89%;在美国奥数竞赛预选赛(AIME),位列前500名学生之列。更重要的是,它在物理、生物、化学问题的基准测试中(GPQA)超过了人类博士水平!以OpenAI此前划分等级来看,o1已经实现了L2级别的推理能力。为了给开发人员提供更高效的解决方案,OpenAI还发布了o1-mini:一种更快、更便宜的小型推理模型。o1-mini非常擅长STEM工科,尤其是数学和编程,而且比o1-preview便宜80%。这对于需要推理,但不需要通用世界知识的应用程序来说,是一种功能强大、性价比高的模型。OpenAI是如何实现o1系列模型的超能力的呢?与以往不同的是,o1在回答问题之前,会用更多时间去「思考问题」。通过训练,它学会完善思维过程,尝试不同策略,并自主识别错误。这背后使用的技术就是「强化学习」(Reinforcement Learning, RL)算法。提出CoT(Chain of Thought)的OpenAI研究员Jason Wei表示,o1不是纯粹地通过提示完成CoT,而是使用强化学习训练模型,最终更好地执行链式思考。之前的大模型LLM更多是堆算力在预训练之上,认为参数越大、数据越多、算力越强效果越好。但自从GPT4以来,就边际投入产出递减了。看起来没有再突破。OpenAI的草莓o1模型与其它大模型LLM不同,它投入更多算力在强化学习(训练时间计算)和推理思考时间(测试时间计算)上面。这样的模式反而大大提高了AI输出内容的价值。而且o1-mini的能力还表示,进行推理时不需要巨大的模型,也能有较好的效果。可以想象,未来各大模型也将大大增加推理时间,大大扩大推理算力的大规模普及和部署。(投资提示:推理芯片的市场空间是不是被大大低估了呢?推理大约不需要预训练时的高密度高强度计算,那会不会至少在推理领域可以打破英伟达的垄断?AMD、博通、INTEL甚至华为、海光会不会都可能开发出一片新的大市场?)目前的o1系列依然处在早期,诸如网络插件、长传文件、图片等能力还未集成。未来Strawberry系列的能力还有很大的扩展空间。最可怕的是,据说GPT-5还要比o1模型更强大69倍。而普通人,可能根本无法理解GPT5的推理和逻辑能力。夏虫语冰的感觉!如果说,原来的大模型LLM还只能替人类做些简单文本工作,产生出来的结果还不大靠谱。那么不远的未来,我们就可以看到大模型可以产生非常专业的成果:可以替代人类研究、分析、计算、执行甚至决策。
到时,AI革命将会把各行各业的产出效率大大提高。我们可能很快就会进入生产效率极高,物质极大丰富的新社会。
那么按照马克思的构想,到时生产关系也要适应生产力的发展,共产主义应该提前到来!到那时,我们就不用纠结于延迟退休了,所有人都在退休的状态:- 共产主义社会生产资料公有,废除了私有制。生产资料归全体人民所有,不再存在剥削和两极分化。不用再羡慕别人地位高、挣的多了。
- 共产主义社会以每个人的全面而自由发展为基本原则。消除阶级对立,实现人与人之间的平等,为人的自由发展创造条件。不用再忙于做自己不喜欢做的工作了。
- 人们自觉为社会利益而劳动,不计报酬,不讲条件。工作不是为了挣钱,而是为了喜欢。
- 共产主义社会实行"各尽所能,按需分配"的原则。每个人根据自己的能力为社会贡献劳动,社会则按照每个人的需要分配产品。物资极大丰富,需要就管够。
---
不知道到时还有多少个人类... ...
算了,先高兴两天,别想烦心事儿了。
祝大家中秋快乐!