百度,再见!我们已经不是同一个物种了

科技   2024-10-14 11:30   山东  
这两天国产版的 OpenAI o1 来了,Kimi 悄悄上线了它自己的探索版,所谓的探索版其实就是 kimi 版本推理能力的加强版。
简单来讲就是,它具备自主海量搜索解决复杂问题的能力。Kimi 探索版能够模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,从而在一定程度上具备了 AI 自主搜索能力。
据说,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。它通过自主策略规划、自动化大规模信息检索、对搜索结果的反思补充等多个步骤,帮助用户更高效地完成分析调研等复杂任务。在内部性能评估测试中,Kimi 探索版的回答准确性和完整性具备全面优势,综合性能超过同类产品至少 30%。
使用 Kimi 探索版,用户可以提出复杂的问题,比如,“分析一下 2024 年 QS 排名前 10 的高校计算机专业硕士申请情况”,Kimi 探索版会将任务拆解成多个子问题,分别搜索并给出答案,不仅提供 QS 排名前 10 的高校名单,还有详细的申请要求。此外,Kimi 探索版还能处理模糊搜索,帮助用户勾起记忆深处的印象。
好了,废话不多说,我被内测到了体验权限,我们一起试一试效果,看看它的实战能力到底如何?
我问它第一个问题:
东北文艺复兴三杰有哪些作品被改编成了影视剧?
看看它如何应对?
体验还不错,整个过程大约几十秒吧,会展示自己的整个思考推理过程。
它首先把这个问题,拆分成了两个小问题,东北三杰是谁?和 东北三杰的哪些作品被改变成了影视剧。
两个小问题按照顺序依次搜索,层层递进,最后给了一个汇总结果。
最令人意外的就是这哥们还会反思,没错,它还具有反思功能,反思过后给你补充信息。
看看,简直绝了,比人还谦虚,知道自己可能不全面,我再补充补充。
这个过程就像是,我刚刚做完了一件事,感觉还不放心,是不是还有遗漏啊?来个查漏补缺。探索版就像是一个强迫症患者,力求达到完美。
我们再来一个难一点的逻辑来试一试它的推理能力,看看效果如何?
题目是:
有九张纸牌,分别为 1 -9 , 甲乙丙丁四人取牌,每人取两张,现已知甲取得两张牌之和是 10,乙取的两张牌之差是 1,丙取的两张牌之商是 3,请说出剩下一张牌是什么?
这个问题,在上个月 OpenAI o1 刚上线当天,我也问过。
看看到了吗?这里会显示自己的搜索和思考过程。
看看它的推理和分析过程,基本上我对比了一下和 OpenAI o1 整个过程,它俩确实差不多。
我准备给它上难度了,就是让它分析和推理一下我们中国复杂的调休制度,看看它能应对吗?
这是中国 2024 年 9 月 9 日(星期一)开始到 10 月 13 日的放假调休安排:上 6 休 3 上 3 休 2 上 5 休 1 上 2 休 7 再上 5 休 1。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?
这个问题,够复杂了吧?看看它的整个分析过程。
如下:
确实分析对了。我们看看它的推理过程哈。
第一步,它列出了放假的调休安排;第二步,它根据放假调休安排,找出来正常的休息日,第三步,它又算了算实际的休息日。最后,它用实际的休息日减去了正常的休息日,算出了,整个假期也就多休息了 4 天。
整个思路还是非常符合逻辑计算过程的。
我再问一个超高难度的题,为难一下它。我相信如果你不熟读《红楼梦》以及不懂天文学、地理学的知识,是很难回答这个问题的,这是一道综合题。
题目就是这个:
林黛玉进贾府的时候,以下哪种情况最有可能发生?
A:太阳直射北回归线;
B:百姓上山采荠菜;
C:黄河侵蚀加强;
D:青藏高原的雪线下降。
它将这个问题分成了两个小问题,它先搜索一下,林黛玉进贾府的时间,找到时间之后,再分析选项和时间的关系,它得出的结论就是:百姓上山采荠菜。
我搜了搜,北方秋天确实有荠菜。
我再让它回答一下《红楼梦》中的未解之谜吧,看看它能不能推理。
在小说《红楼梦》中,林黛玉的父亲林如海去世后,她似乎并没有继承到丰厚的家产,相反,贾府似乎得到了一大笔财富。能不能帮我推理一下,为什么林黛玉没有继承家产?而贾府的这笔财富又是从何而来?
它将问题拆成了两个小问题,分别搜索,然后进行了汇总总结。
整体的效果,总体体验下来,我感觉还可以。
另外,整个体验过程,相信大家都看到了?你扔给它一个大问题,它会自动帮你拆分成一些小问题,然后按照逻辑去搜索,最后再汇总。
这个过程确实是我们人类的思考过程,不过,要想让 Kimi 探索版生成的内容更符合你的要求,其实,我们可以采取思维链的方式,将大问题提出来之后,再列出小问题,让它根据各个小问题去搜索,再整理。
换句话讲,就是让 AI 根据我们的思路去思考,去逻辑推理。
比如:
分析 2024 年中国手机市场的情况,并根据降价预测提供购买建议。
1、搜索并列出 2024 年 1 月至 9 月中国市场手机的销量榜单;
2、使用数学模型或 Python 代码分析 2024 年 1-9 月销量最高的手机;
3、基于历史价格数据和当前趋势预测价格走向;
4、假设预算为 3000 元人民币,分析如何以最优惠的价格购买 top5 中的任意两款手机;
5、将信息整理成表格:列出:手机名称、当前价格、预计降价时间和幅度、推荐购买时间等。
6、综合以上分析给出最佳购买方案和时间建议。
这样的话,我们把思考过程给它,它就像是被我们调教的学生一样,按照我们的思考方式和过程去帮你分析和整理了。
所以,你看,整个过程使用下来,它不仅可以非常丝滑的替代搜索引擎,还可以成为你的私人小秘和助手,让它按照你的思维去思考。
目前 Kimi 探索版还处在内测期间,正逐步分批上线 Web 端,这周一开始开放给全量用户。用户每天可以使用 5 次,而移动端 APP 则将在后续上线该功能。
今天应该大多数用户都可以使用了。
目前使用方法很简单,用 “/” 可以快捷启动探索版,或者点击探索版按钮两种方式。

大家快去看看是不是已经灰度到自己了。
通过体验 OpenAI o1 和 Kimi 探索版,给我最大的一个感受就是 AI 搜索和百度这类搜索引擎不是同一个物种了。
—  —
欢迎大家加入我的「AIGC 掘金研习社」,里面有很多 AI 的玩法和落地应用场景,包括有 ChatGPT 的教程。
只需要 49 元可以享受全年各种教程更新的福利,相比于市面上的星球绝对超值。教程内容涵盖:ChatGPT ,AI 绘画,AI 音乐制作,国产 AI 各种玩法和教程,还有 AI 副业变现内容等各种落地应用场景。
一年 49 元,平均一条 2 毛。绝对超值,目的就是带着大家入门。
现在搞活动,立减 50 ,只需要 49,后期随着加入的人越多,价格可能上涨哈,早学早享受。
持续干货分享,绝对超值。
点击下方公众号卡片,关注我
我们一起感受 AI 的神奇世界

非著名程序员
关注我,一个带领程序员开阔眼界,提升认知,突破圈层,实现个体崛起的公众号。
 最新文章