kimi又放大招,国内第一个具备推理思考大模型

科技   2024-10-17 08:02   重庆  
感谢阅读,我是江枫,专注AI,编程,副业领域。
关注公众号可领取一份大礼包,包含AI/python/副业 资料。


今天打开kimi,发现有点变化。发现多了个探索版。输入 / 就可以打开。


Kimi 又在玩啥新玩意?



我以为是之前kimi智能助手改版了,输入@后发现并不是改版,确实  探索版是个新功能了


输入 / 提示enter进入kimi探索版


进来后,发现还真是新功能,而且还在内测中。估计是我被灰度到了。但是每天只有5次的使用次数。


根据上面的描述,kimi会拆解复杂问题,能更深入的探索。嗯,这让我想到了什么,Kimi难道在对标openAI的o1么?


openAI o1

OpenAI 的 o1 模型是针对复杂推理问题而设计的大模型,也被称为“草莓模型”。它能够进行更长时间的“思考”,并且随着思考时间的增加,推理质量也得到提高。o1 模型采用了基于强化学习的内化思维链学习,通过思维链式的问题拆解,模型可以不断验证和纠错



上面的介绍可以看出o1模型具备推理能力。那kimi探索版究竟如何,正好有5次使用,我就来测试下



01

 第一次测试

先让kimi给出 唐朝安史之乱的主要战役地点,以及对应的现代城市和地区


根据历史时间轴给出了事件,地点,以及现在的城市。并且搜索了53个网页,要是我自己去搜,眼睛都要看麻。


在最后,还有一次反思。对之前的回答内容进行了一次回溯。


那如果不用kimi探索版,结果如何呢。同样的问题我们再来一遍。


上面的结果和探索版相比,一是搜索的页面少了,只有37个。第二是只列出了地点,没有给出时间轴上的关键事件。不过地点也是根据时间发展来排列的


02

 来点更复杂的

如果上面的对比 体现不出差距,那我们就来个复杂的,来计算下甄嬛的生日和薛宝钗的生日相差几天?


同样先给出了3个计算步骤,先确定甄嬛生日,再确定薛宝钗的生日。最后再计算相差的天数,得出最后生日相差的天数


不过这里Kimi有点翻车了,二月有30天,三月有30天。明显是错了。


而用普通的kimi搜索,能确定出生日期,但是无法计算


只有进一步指示计算两个日期的差距的时候,才会计算出来。这个计算结果是对的。


甄嬛和薛宝钗的生日计算功能是kimi自带的,可能会有网友质疑是不是早就计算好了。我重新用了2个人,爱因斯坦和法拉第。一样的可以计算出来



03

还能更难么

再来用更难的逻辑题来考察下kimi。我用一道逻辑推论题来考察,并且特地强调不要使用联网功能


这样完全凭借kimi自己的大模型来计算



真正做到了根据思维链思考的模式来进行解答。问题的答案也非常准确。


04

 国内其他大模型如何?

就上面的表现和国内其他大模型来比较下


元宝:


智谱


元宝和智谱我觉得在国内做得还不错的都无法得出结果,其他家的我也没兴趣来试了。



 写在最后

kimi作为国产之光,在演进方面还是与时俱进的。虽然和openAI比起来还有差距,不过只要在追赶的路上,那么就值得肯定


另外我觉得等kimi正式推出这个功能的时候,要么每天只有一定次数使用,要么就是付费使用了。

程序猿玩AI
玩AI的程序猿: 江枫,专注AI工具,AI副业,AI智能体,分享AI新闻
 最新文章