大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
作为AI搜索工具,信息的时效性是评估其搜索质量的重要指标之一。
刚刚落下帷幕的2024美国大选无疑是一个很好的AI搜索测试案例。这种具有明确结果的问题非常符合AI搜索的使用场景,因为AI模型很擅长从多个信息源中抽丝剥茧,整理、分析检索内容,然后生成答案。从根本来看,这得益于AI模型对于海量数据的处理和总结能力,形成了从n到1的结果。
对于这类问题,如果用传统的搜索引擎肯定也能找到答案,但需要我们逐一筛选搜索结果,然后确定可靠的信息源。AI搜索则更加直接,一步到位。
今天就以2024美国大选作为关键词,测试国内外各个AI搜索工具的表现,包括一周前刚发布的ChatGPT Search。需要注意的是,不具有联网搜索能力的AI工具不在测试范围内,比如Claude。
提示词
总结2024美国大选。
既然是AI搜索工具,就没必要设置很复杂的提示词,简单描述搜索目标就行。
1. ChatGPT Search
综合评价:优秀。
ChatGPT Search是OpenAI近期推出的新功能,本质上就是之前“炒”的沸沸扬扬的SearchGPT。依托于综合能力比较强的GPT-4o
模型,“智商”比较高,响应速度快,对中文的支持很友好,这都是它的优点。
可以看到,在这次搜索中,ChatGPT Search搜索到了准确答案,并且,每一处信息源的调用都标注了明确的信息来源,点击可以跳转。就信息源来看,比较广泛,中、英文信息源都有。
2. Perplexity
综合评价:优秀。
Perplexity,简称是PPLX,AI搜索领域的老大哥,凭借AI搜索这一项位列TOP 50生成式AI Web网页应用的第三名。
回答内容丰富,本次测试用的模型是Claude 3.5 Sonnet
,该模型在Perplexity中的回答特点就是比较简洁精炼,从本次的回答中也能看出来。信息源同样有中文也有英文,主要来源是各大新闻媒体。
3. You AI
综合评价:中等。
同样选的是Claude 3.5 Sonnet
模型,但总体表现个人感觉不如上面的Perplexity,主要表现为信息源不够丰富,导致回答太过简略。
4. Kimi探索版
综合评价:优秀。
Kimi探索版的能力毋庸置疑,在这次搜索中阅读了64个网页。从回答结果来看,答案本身正确无误,并且信息非常具体,比如清晰地指出了哪几个摇摆州。
5. 智谱AI搜索
智能体
综合评价:中等。
智谱的AI搜索
智能体也是推理型AI搜索,虽然看上去洋洋洒洒回答了一大篇内容,但最关键的“选举结果”没有很清晰的指出,而是表示“选举结果仍在紧张等待中”,这是不符合实际情况的。
6. 360AI搜索慢思考模式
综合评价:无法评价。
360AI搜索对这个问题拒绝回答。
7. 天工AI高级模式
综合评价:优秀。
天工AI的高级模式是近期推出的新功能,从回答可以看出,整体表现确实不错。天工的回答是本次测试中最全面、最长的,条理也比较清晰,分别概述了背景、过程、结果和影响。
但也因为回答过长,容易让用户抓不住重点,并且由于回答中穿插了图片,整体回答显得甚至有点“臃肿”。
8. 秘塔AI搜索-深入模式
综合评价:优秀。
秘塔是唯一一个以完整段落回答的AI搜索工具。这本身并没有什么问题,但可以整理成更加有条理的形式,更便于阅读和理解。
但有一说一,秘塔的搜索结果没有问题,回答的也算比较全面。
结语
8个AI搜索工具,你最喜欢哪个?欢迎评论区留言讨论。
精选推荐
国内支付宝开通ChatGPT Plus和Claude Pro 2024最新教程! 『AI保姆级教程』无需手机号!三分钟注册ChatGPT账号!2024年最新教程! 『AI保姆级教程』手把手教你注册Claude账号!建议收藏!
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。