今天打开kimi,发现有点变化。发现多了个探索版。输入 / 就可以打开。
Kimi 又在玩啥新玩意?
我以为是之前kimi智能助手改版了,输入@后发现并不是改版,确实 探索版是个新功能了
输入 / 提示enter进入kimi探索版
进来后,发现还真是新功能,而且还在内测中。估计是我被灰度到了。但是每天只有5次的使用次数。
根据上面的描述,kimi会拆解复杂问题,能更深入的探索。嗯,这让我想到了什么,Kimi难道在对标openAI的o1么?
openAI o1
OpenAI 的 o1 模型是针对复杂推理问题而设计的大模型,也被称为“草莓模型”。它能够进行更长时间的“思考”,并且随着思考时间的增加,推理质量也得到提高。o1 模型采用了基于强化学习的内化思维链学习,通过思维链式的问题拆解,模型可以不断验证和纠错
上面的介绍可以看出o1模型具备推理能力。那kimi探索版究竟如何,正好有5次使用,我就来测试下
01
第一次测试
先让kimi给出 唐朝安史之乱的主要战役地点,以及对应的现代城市和地区
根据历史时间轴给出了事件,地点,以及现在的城市。并且搜索了53个网页,要是我自己去搜,眼睛都要看麻。
在最后,还有一次反思。对之前的回答内容进行了一次回溯。
那如果不用kimi探索版,结果如何呢。同样的问题我们再来一遍。
上面的结果和探索版相比,一是搜索的页面少了,只有37个。第二是只列出了地点,没有给出时间轴上的关键事件。不过地点也是根据时间发展来排列的
02
来点更复杂的
如果上面的对比 体现不出差距,那我们就来个复杂的,来计算下甄嬛的生日和薛宝钗的生日相差几天?
同样先给出了3个计算步骤,先确定甄嬛生日,再确定薛宝钗的生日。最后再计算相差的天数,得出最后生日相差的天数
不过这里Kimi有点翻车了,二月有30天,三月有30天。明显是错了。
而用普通的kimi搜索,能确定出生日期,但是无法计算
只有进一步指示计算两个日期的差距的时候,才会计算出来。这个计算结果是对的。
甄嬛和薛宝钗的生日计算功能是kimi自带的,可能会有网友质疑是不是早就计算好了。我重新用了2个人,爱因斯坦和法拉第。一样的可以计算出来
03
还能更难么
再来用更难的逻辑题来考察下kimi。我用一道逻辑推论题来考察,并且特地强调不要使用联网功能
这样完全凭借kimi自己的大模型来计算
真正做到了根据思维链思考的模式来进行解答。问题的答案也非常准确。
04
国内其他大模型如何?
就上面的表现和国内其他大模型来比较下
元宝:
智谱
元宝和智谱我觉得在国内做得还不错的都无法得出结果,其他家的我也没兴趣来试了。
写在最后
kimi作为国产之光,在演进方面还是与时俱进的。虽然和openAI比起来还有差距,不过只要在追赶的路上,那么就值得肯定
另外我觉得等kimi正式推出这个功能的时候,要么每天只有一定次数使用,要么就是付费使用了。