首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

曾让Kimi「崩了」的探索版有多厉害？10倍搜索量、精读超500页面，一手实测来了

科技 2024-10-14 16:36 北京

AI好好用报道

编辑：杨文

Kimi国庆「憋」大招，「憋」出个探索版。

前不久，市场上就有传言称，月之暗面国庆「憋大招」。

至于这个「大招」具体是啥，众说纷纭：

有人说和多模态有关，还有人说是关于深度推理的。

不过，就在上周五，月之暗面高调宣布，上线 Kimi 探索版。

消息一出，不少体验者纷纷涌入官网，「Kimi 崩了」也一度登上热搜。

那么，这个探索版厉害在哪儿？它与 Kimi 普通版有啥区别？

这么说吧，Kimi 探索版的搜索量是普通版的 10 倍，一次搜索即可精读超过 500 个页面。

而且，它还能模拟人类的推理思考过程，多级分解复杂问题，并进行深度搜索，即时反思改进结果。

这似乎和 OpenAI 的 o1 有着异曲同工之妙。

Kimi 官方也很自信，「如果 Kimi 搜不到的信息，那大概率用户也很难自己通过传统搜索引擎找到」。

接下来，我们就实地测评一下，看看 10 倍搜索量、一次搜索可精读超 500 个页面的 Kimi 探索版，到底是搞噱头还是真实力？

Kimi 官网链接：https://kimi.moonshot.cn/

1. 中国票房过四十亿的电影都讲了什么故事？

我们先通过这个娱乐性的问题，一窥 Kimi 探索版的「脑回路」。

在答题之前，它会像分析师一样，预先规划解决问题的整体策略，将复杂问题分解为层次化的子问题，然后分步来执行。

具体来说，它先全网搜索中国票房过 40 亿的电影，然后查找这些电影的故事情节介绍。

在搜索过程中，它会把复杂提问转换成多个匹配的搜索关键词，并基于前一步的搜索结果来实时生成下一步的搜索关键词。

此外，它还能即时反思搜索结果，在发现第一次回答中的情节简介存在信息缺失时，会主动补充更多内容。

我们又让它来总结上榜的电影具体票房，其回答与搜索引擎上的结果一致。

那么，Kimi 普通版的表现如何呢？

其工作流程是先理解问题，然后通过较为粗略的关键词搜索网页。

从网页阅读数量来看，普通版仅阅读了 25 个网页，而探索版则是 40 个。

虽然普通版整体上回答没毛病，但是对于影片故事的介绍过于简单，也无法反思搜索结果。

2. 请帮我总结一下特斯拉发布会

前几天的特斯拉发布会算是科技圈的大新闻了。

我们就让它总结一下特斯拉发布会的情况。

它阅读了 11 个网页，并在界面右侧显示所有的搜索结果，从中提取出四大亮点，分别是 Robotaxi、Robovan、Optimus 机器人和 FSD 自动驾驶，还分条缕析地介绍了它们的功能、设计、成本等。

我们进行了一一比对，回答全部正确，没有出现满嘴跑火车的现象。

我们继续追问，特斯拉发布了无人驾驶出租车，为啥股票会跌？

Kimi 探索版不仅搜索了中文网站，还使用英文关键词，网罗了 CBS、CNN 等外文媒体报道。

如果我们点击它回答中的小引号，界面右侧则会显示出引用的原文信息，这极大地降低了幻觉发生的可能性。

3. 甄嬛的生日和薛宝钗的生日相差几天？

我们再来问个无厘头的问题。

一直以来，大模型都是重度偏科者，写小作文嘎嘎好使，但一到数学题就抓瞎 ——

9.9 和 9.11 谁大分不清，strawberry 几个 r 搞不明白。

不过，计算甄嬛和薛宝钗这俩八杆子打不着的影视人物的生日，Kimi 探索版有一套自己的解题思路。

在答题之前，Kimi 探索版先是全网搜索甄嬛和薛宝钗的生日分别是哪天，并在页面右侧显示所有的搜索结果。

然后来到重头戏，计算二者生日差值。

它先算出从正月二十一到四月十七，每个月有几天，然后分别算出总天数，全部相加即可。

不过，它的回答还是有瑕疵，因为农历月份长度以朔望月为准，正月的天数并不固定，因此最终的计算结果仍有偏差。

4.Elon Musk 的生日和 Sam AItman 的生日相差几天？详细介绍计算过程。

农历的计算方法过于复杂，我们也搞不清楚，因此，就让 Kimi 探索版再计算一下马斯克和奥特曼的生日差。

我们专门用日期计算器检验了一下，Kimi 探索版回答正确。

5. 奥利弗在星期五摘了 44 个猕猴桃。然后在星期六摘了 58 个猕猴桃。星期天，他摘的猕猴桃数量是星期五的两倍，但其中 5 个比平均大小要小。奥利弗有多少个猕猴桃？

前天，机器之心发布了一篇题为《给小学数学题加句「废话」，OpenAI o1 就翻车了，苹果新论文质疑 AI 推理能力》的文章。

我们就拿文中的数学题来测一下 Kimi 探索版。

先来个正常的：奥利弗在星期五摘了 44 个猕猴桃。然后在星期六摘了 58 个猕猴桃。星期天，他摘的猕猴桃数量是星期五的两倍，奥利弗有多少个猕猴桃？

Kimi 探索版先把思路梳理得清清楚楚，然后每一步的执行都相当准确。

我们又在这道题目中，加了一句废话「但其中 5 个比平均大小要小」，OpenAI 的 o1 就翻了车。

但是，Kimi 探索版竟然没有被误导，得出了正确答案。

目前，Kimi 探索版已覆盖全量用户。大家也抓紧去薅一波吧～

工具链接——

Kimi官网链接：https://kimi.moonshot.cn/

以后我们会带来更多好玩的AI评测，也欢迎大家进群交流。

© THE END

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

http://mp.weixin.qq.com/s?__biz=MzUyODA3MDUwMA==&mid=2247523616&idx=1&sn=0b62b34f76401ea8504d2522e7f2a2dc

发现人工智能创新应用

最新文章

好东西！又来个播客界的谷歌NotebookLM，靠记笔记画脑图，月入近5万

马斯克前女友看好的AI玩具生意，在国内卷起来了

好潮！日本又造了个「美丽小废物」，卖926元

一个AI浣熊账号的高开癫走：仅靠82篇帖子、4个月涨粉近14万！

特斯拉卖起机器人玩具！售价40美元被抢光，二手价高达1300美元

谷歌又捣鼓出好东西！有了这款AI学习神器，考试起码多考50分

AI解锁500多年的圣殿，米开朗基罗杰作，你我触手可及

机器人界出了个「达芬奇」，画一幅图灵肖像，卖了108万美元

AI能夺走网文界的一切吗？

实测国内首个AI播客！有点意思，但NotebookLM还是大爷

告别买家秀！一张图就能生成AI穿搭视频，网友：10块钱一套

从文本到屏幕：「Project Jarvis」们能实现 AGI 吗？

实测4大AI搜索：ChatGPT Search频翻车，Perplexity仍是「王者」

美团的这些AI应用，倒把我给整不会了

全球「最轻」人形机器人，成都造！仅25公斤，能换鞋、递药、冲咖啡

养猪、插秧、搬货……这才是机器人该干的活儿

为了口吃的，一群伦敦老铁给谷歌AI「下毒」

波兰小哥花了十年，造了个僵尸机器人

叫好不叫座！2.5万卖不动！苹果Vision Pro或将年底停产

真·赛博菩萨！最大的开源视频模型来了，我们实测：有点东西，但不多

哈工大造了个长轮子的小机器人，卖到2100元

AI大冰嘴替，骂醒「满脑浆糊」的网友

萌化了！日本造了个AI宠物，卖2800元被疯抢

火爆全网、打败王者荣耀的卷饼小游戏，竟是AI造的？

人脸识别的「巅峰」之作！甭管整成啥样，3秒扒出你是谁

曾让Kimi「崩了」的探索版有多厉害？10倍搜索量、精读超500页面，一手实测来了

一副AI耳机卖1200元？端侧AI大模型+硬件= ？这场论坛带你一探究竟

NotebookLM新功能引发网络疯传，AI大神、Altman大赞，一手实测来了

谨以此文，向飞天奖的AI整活视频「致敬」

最新测评！美图大模型提前揭秘，这波风格化美到窒息

不像人也不像狗，腾讯最新家用机器人有点「离经叛道」

留子们用火星文写避雷帖，AI竟看懂了？我们实测：几乎全军覆没

AI在用 | 吵架又没发挥好？7个AI大佬帮你自救

OpenAI大秀肌肉，一口气放出10个新模型Demo，全球网友玩疯了

最全测评！Vidu全球首个新功能，搞定「美女变野兽」难题

AI这个「狗头军师」，教年轻人说「土味情话」贼油腻

看到苹果和华为「互抡大锤」，我不厚道地笑了

世界首例：一位「00后」让人形机器人住进了家

最专业的法律 AI 准确率也只能到 65%？哪些场景下的法律 AI 是靠谱的？

华人小哥搞出一个鸡鸣狗叫GPT，可识别「毛孩子」80%的情绪

这款AI神器登上GitHub热榜第一，它真能革了照相馆的命？

与人类共度一年后，机器人的人生开了挂

一只AI吗喽，单挑《黑神话》，歇菜1000次，终于击败首个Boss

还在死磕镜头？聪明人已经用AI拍时尚广告大片了

a16z 最新 AI 应用 TOP100 榜单公布：消费者最爱用谁家应用？

6小时视频，一键转成PPT，赵晓卉们再也不用发疯了

我有一个「赛博爱人」，拥有超长记忆，还能给足情绪价值

AI在用 |「国乒喜剧人」许昕搞的Logo火了，我用AI整了个

AI在用 | 雷总，我把你的出道曲《Are You OK》搞成了动画MV

科波拉的史诗级巨制还没上映，就被AI搞砸了预告片

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉