我发现啊,很多 AI 公司都喜欢闷头干大事,主打的就是一个沉淀,顶峰相见
表面上看着几个月没啥动静,却都喜欢突然给你蹦出一个大的来
上个月 OpenAI 又是没有任何预警的突然发布了 o1 模型,宣布其可以进行通用复杂推理,面对博士水平的物理问题时,GPT-4o还是 " 不及格 " 59.5 分,o1 直接干到了相当夸张的 92.8 分!
总体而言 o1 模型的推理能力毋庸置疑真的强
但不管是网友们的测评,甚至包括官方的演示文档,都有非常强烈的「做题」感:做物理题、做数学竞赛题、做编程算法题...
说实话,绝大多数用户都是普通人,谁没事天天抱着 A I 算鸡兔同笼啊
并且最关键是:o1 模型每百万输入 15 美元,每百万输出 60 美元,再加上它是个推理模型,其中间思考过程所消耗的步骤也会被算作输出计费,结果就是平均提一个问题差不多要花费 10 元左右,真没哪个普通人能消费的起...
而针对以上问题,Kimi 在一个月之后,给出了他们的答案:
“Kimi 的慢思考,选择把推理能力用在知识工作者与大学生用户更日常的生产力场景中,尤其是调研分析类任务
”
这些任务是发现和创造新知识的基础,也是必经之路!也正因为有取舍,这才使得我们普罗大众也能真正用上这样强大的新技术
是的,Kimi 的深入搜索功能,上线即免费,这次阿虚也是有幸拿到了内测机会
1
高搜商的自主搜索
Kimi 官方内部将这次更新称之为——高搜商的 Kimi 来了!
输入 / 后回车,或者点击左下角,即可轻松开启全新的 Kimi 探索版深入搜索模式 ~
这个模式下,Kimi 会改变传统那种你问我答的快思考,转而模拟我们人类最核心的思考方式——慢思考
以前的模式,大模型的问答就是大量刷题后下意识出答案,你问我太阳从哪边出来,我直接秒答东边。而探索版的慢思考模式下,Kimi 会主动拆解长难提问+自己规划解答思路,进行分步搜索与推理!
为了测试下 Kimi 新模式的能能力,阿虚一上来就问了个我一直非常好奇,但又一直懒得去搜的问题:就是历年的黄金价格和平均工资到底啥关系???
而当我把问题输进去之后,只见 Kimi 真的很人模人样的开始从 2023 年的黄金平均价格开始搜,然后是 2022 年、2021年......
不是尝试去找已有的资料、现成的答案,而是真正分析问题后自己分步搜索信息尝试解决问题!
而且这个搜索深度还真挺夸张的,上述问题 Kimi 一口气就替我读了 100 多个网页去搜集信息(知道为啥我一直懒得搜了吧 ಥ_ಥ)
最后给到的表格数据也是相当完整的,我要求的「年平均工资能买的黄金」这个自定义数据也有给我正确算出来,结果还真挺符合我记忆中的感觉,2018 年结婚的那波人还真就 " 赚翻 " 了
接着阿虚又从我星球找来了一个最常见的「产品推荐」类问题:3D动画制作专业买电脑主要考虑哪些参数配置?
当时我给这位粉丝写回答还是花了有小 10 到 20 分钟的,到 Kimi 这里就是框框一顿开始分析、拆分问题:先是找到软件,再是一个个去找软件要求的配置...
最后给出的答案没想到相当之准确,的确是该优先考虑 CPU 和内存,显卡虽然重要但主要只影响「实时渲染」这一块也描述的准确无误!
和我在知识星球上人工做出的回答,如出一辙
▲阿虚之前的部分回答
关键还是推荐的电脑也相当之靠谱,联想 小新14/16Pro、七彩虹 隐星 P15、惠普 战66 这些在猪王笔吧评测室最新的选购指南文章中都是有推荐的
看来产品推荐这一块 Kimi 现在也已经是稳稳拿捏,那还有什么问题能考验下他呢?
我想了半天,问了一个我老婆挺感兴趣的问题:现在是不是越来越多人给孩子取3个字的名字了?
Kimi 依然主打一个吃苦耐劳不怕累,又是硬生生读了近百个网页来为我寻找答案
在分析姓名趋势原因这块更是帮我把提问中简单的「为什么」几个字,给扩充到具体关键词:文化影响、社会因素、家长偏好、时代背景...
说实话,这个问题之前只是好奇,一直没搜。今天测下来搜到结果相当出乎我的意料:2020年的时候新生儿的三字姓名比例竟然已经超过90%了,二字姓名仅占6.3%
PS:后续我又追问了下 Kimi,这个数据相当可靠,来源是公安部发布的《2020年全国姓名报告》
除此之外,我还特别注意到了一点,就是 Kimi 下完结论之后,还特别补充了一些不同的信息,提到了「父姓加母姓现象的兴起」与「经济」对于取名的影响
事实上同个问题我后来又拿着去问了目前同样支持深度搜索的通义、豆包、元宝,而关于这2点真只有 Kimi 提到了!
顺便说一下,关于回答来源这块,对比同行 Kimi 读了 95 个网页还真可以算得上是 " 饱读诗书 " 了
Kimi 之前就一直深耕长文本阅读+总结能力,这波升级啊简直就是把之前读本地文件的功夫搬到联网搜索上来了,纯纯一个 Plus 增强!
而且在这次升级后,我明显感到,Kimi 不仅是「搜商」变高了,「智商」也是进一步增强了!
原因是我试着问了下 Kimi 前段时间人人都在关心的延迟退休问题
面对这个问题,Kimi 依然相当准确的对问题进行了分步搜索,查询且正确理解了最新的退休政策(每2个月延迟1个月),同时还能将规则准确运用于计算!
而我拿着同个问题去同行那里问了一下:文心告诉我51岁、智谱多算了5个月、星火说54岁、元宝告诉我要55岁,豆包直接没给我算,只有通义也算对了
当然官方有专门的小程序可以直接查询,这个问题用不上 AI 来帮忙~
不过对比之下,Kimi 升级后真的变聪明了,做到了及时抓取最新网络信息并加以理解与应用!
2
自我反思
值得一提的是,在我测试过程中,无意发现了升级后的 Kimi 还学会自我反思了!?
我试着让他帮我整理一下:张小龙所有的微信公开课链接
没想到他在好好回答完问题之后,突然给我来了句: " 诶,等等,我又想到了! "
整个过程我没有干预他,完全是他自己回答完问题之后又检查了一遍,发现可能还有不足,立马及时进行了补充
不仅可以模拟人类拆解难题分布解决,竟然连人类的事后反思也给学会了,害怕!
不过有关这点我后续测试了不少,发现并不是所有问题都能行,只有问一些比较模糊类的问题时才能触发
比如我试着让他帮忙找了下宫崎骏的一句话出处,Kimi 就先是根据公开信息确认了的确是宫崎骏说的,然后可能意识到第三方媒体报道不一定能确认出处,反思的时候又额外阅读了 30 多个网页,成功帮我确定了出处纪录片!
又或者让他帮忙调查一些比较冷门的信息,Kimi 也会意识到回答的可能太过简短、没有营养,进而尝试再多深扒一下~
整个一番测试下来,阿虚感受最深的还是:Kimi 不愧是那个懂用户的 Kimi
关注和主打的用户群体一直没变,打工人、知识工作者、大学生...
无论 200W 字长文本阅读,之前的 AI PPT 生成,还是这次的深入搜索,每一次新功能都是解决实际生产工作中的痛点!
相比起 OpenAI 画的大饼:视频通话迟迟没上线,GPT5 遥遥无期,sora 依然仅仅活在论文里
我还是觉得 Kimi 这种能实打实落地的功能更有意义!
最后,这次更新的 Kimi 深入搜索,依旧是上线就即全面开放使用,目前完全免费:kimi.ai
浏览器访问上述链接,即可快速体验!大家有什么好奇想问的,就赶紧去试试吧~
👇点击“阅读原文”,也可跳转 Kimi 官网