前言
自从今年9月13日GPT-o1发布以来,一场关于大模型在深度思考和复杂问题处理能力上的较量便在全球范围内悄然展开。
在这场激烈的竞赛中,咱们国内的大模型厂商们不甘示弱,纷纷推出了自己的杰作!包括k0 math、DeepSeek-R1-Lite、Skywork o1等模型。
可谓各具特色,共同展现了我国在人工智能领域的创新实力和快速进步。也让我越来越期待还没发布的各家又在捣鼓着什么“狠活”
正所谓好饭不怕晚,终于在2024年的最后一天咱们的“靠谱青年”也是推出了它们家的最新类o1模型—GLM-Zero-Preview(下面简称Zero推理模型)
特别的Zero
在经过了长达16S的思考后,回答给我们的感觉却是:理解了,但是完全没有理解…
(上方为长图,请滑动查看)
之后俺还问了一道弱智吧精选。
智谱也能精准的点出喝酒是主要原因,压力是间接原因……
当然啦,目前还是不能做到弱智吧这种富有哲学的回答。
万一哪天AI大模型要是真这么回答了,莫理我可能就要带头投敌了~(笑
除去这种偏向娱乐性质的,GLM-Zero推理模型在专业领域同样是相当能打。
要知道它实际上是 GLM-Zero 系列中专注于增强 AI推理能力的模型,因此对于数理逻辑、代码和需要深度推理的复杂问题才属于专业对口。
Be like 👇
这是我之前看见有人向GPT-O1询问的一个数学题,感觉特别有意思,一下就让我想起来三体中秦国的人列计算机。
智谱对于这种问题的思考可以说非常的严谨。
先是从预估每人一秒计算一次,到每人计算十次,最后到思考到人类对于复杂问题独特的优势…
只可惜算来算去还是比不过现代计算机
对于这种有趣的物理问题,它也会首先考虑到在实际上是不可能实现的,然后在纯理论的基础上思考分析。
同时我还故意问了它一个著名的悖论问题,回答可以说是情理之中预料之外吧 。
情理之中是知道它能够告诉我这个问题的答案,意料之外则是没想到它会像这样清晰的使用数列极限来解释。
如果俺没记错的话,极限与收敛相关可是考研数学题了。
为此莫理加大难度直接搬出了2024年数二真题~
也是看了Zero推理模型的思考过程,莫理才终于明白老师以前说的数学思维到底是什么。不仅算出了正确答案还通过演算检验排除了错误。
与现有模型不同,GLM-Zero-Preview 能够初步实现推理过程中自主决策、问题拆解和尝试多种方式解决问题。
对比Open AI等产品不说超越也还是能算得上是不分伯仲,各有千秋的~
目前 GLM-Zero-Preview 已经上线使用,大家可以直接前往「智谱清言」选择「Zero推理模型」智能体免费体验~
https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
https://bigmodel.cn/dev/api/normal-model/glm-zero-preview
https://zhipuaishengchan.datasink.sensorsdata.cn/t/7K
开发者可以在「智谱开放平台」中,通过 API 进行调用。
同时智谱团队也是很诚恳的指出了目前的 GLM-Zero-Preview 与 OpenAI 的 o3 模型还有不少的差距。
相比较有些团队无脑自嗨的对比,莫理还是更喜欢这种”老实人“。
毕竟只有看见差距、承认差距才会沉下心来不断努力取得最后的成功~
本文发表于公众号【莫理】
▽▽▽