大意了,秘塔告诉我杨子是双子座???|AI测评师

创业   2024-11-14 18:07   浙江  

遇事不决,上小红书搜。

受够了普通搜索引擎无尽广告的“虐待”和“欺骗”后,越来越多人将搜索任务放到了小红书上。不过小红书毕竟是社交软件和种草平台,搜索功能只能算其“斜杠”副业之一。通常而言,在小红书中输入一个信息后,极有可能给到一堆相关案例,辩论真假和有效性的过程,还是要耗费不少心力。

那有没有别的方法?这不AI搜索来了!

刚刚结束的美国大选,Perplexity就出了不少风头:在各大AI应用纷纷禁止回答选举相关问题的时候,Perplexity逆流而上,上线了选举信息中心实时追踪竞选,信息来源也是靠谱的美联社(美国第一大通讯社)和Democracy Works(无党派非盈利组织)。

至于国内市场,掰着指头就能数出秘塔、天工、Kimi等多款产品。

本期测评师,让我们一起走进AI搜索大模型的世界。看看AI搜索到底靠不靠谱;中美搜索之间有什么差别;是否真的和网上夸的那样好,丝滑解决各种烦恼;以及对于我们普通人而言,AI搜索大模型是否可以代替百度、Google、小红书,成为新一代搜索的神?

如果觉得文章太长,也可以看省流版:

1、娱乐话题,尤其是非知名人物话题,不论国产或是海外AI搜索产品,信源基本无法保障,错误率之高不如小红书来得列文虎克。

2、严肃性话题,国内外AI产品会略有差异,这和数据来源有很大关系。例如,国内AI产品更偏好中文语境下的文章,海外以英语为主。

3、秘塔是国内与Perplexity最相似的产品之一,参考依据包括语言逻辑、信源采集、答案相似度等。

4、大部分AI产品已实现连续性问题回答,让产品更具“人性”。

薛定谔的杨子星座

2024年11月什么最火?中文互联网有“华人春晚”再见爱人4,外网有懂王再次“登基”。

先聊聊中文互联网,鉴于杨子、麦琳实在太火了,如果问一下乳腺问题,可能会一下子炸场,所以我们抛个简单问题给秘塔:杨子是什么星座?

图源:秘塔

图源:Kimi

图源:Kimi信息来源

什么?秘塔居然说杨子是双子座?

什么?Kimi说是天秤座?

什么?Perplexity也来混插一脚,说是天蝎座?

天工倒是正经了点,细致问到底哪个“杨子”,给了限定词后,“确诊”为双子座。

或许是因为问的人物实在不是什么流量大明星(但真的很火啊,最近!),给到的信源参考都不太正经,不是什么塔罗算命、八字命理的营销文,就是百度知道、知乎问答这样的路人回答。

那么,杨子到底是什么星座?

百度给出的答案是狮子座。众所周知,618是大促日(划掉),是双子座。文心一言肯定不会犯这种不对号的低级错误,但不论是信源(2个百度百科),还是直接的回答,都没能解释这两者间的关系。

小朋友我,满头都是问号。(别问为什么不问Google,咱中国明星到国际舞台,实在是,错误率更高)

最终妥协,转向万能的redbook。点开第一条,狮子座。按照博主说法,是杨子在电视节目上自己说的6月18日的农历生日,从而推断出狮子座(与百度答案重合)。鉴于本人没有逐帧分析再见爱人4,又看了其他几条内容,发现了节目有关截图。

至此,我已全面倒戈向狮子座。

图源:小红书

另外,水母我也搜了再见爱人4的另一个话题人物——麦琳。在各大AI搜索上,关于她的内容真的很少,容易指向错误的人选,无法做到有效判断。

聊完了国内,咱再聊聊国外的事儿。问题很简单:What's the relationship between Elon Musk and Donald Trump?

以下是Perplexity给出的答案(中文为Google 翻译),参考信源7条,包括美国广播公司、商业内幕、全国广播公司、新德里电视台等。基本可以宣告靠谱?

另外,我们来看一下内容质量,把两人关系的时间线也拉了出来,对于不了解美国政坛的人而言,这是一次很好的梳理和回顾。

图源:Perplexity

那么国内AI搜索呢?

Kimi给了整整71条网页参考,靠谱与不靠谱对半开。落回到关系本身,则只局限于当前状态下的关系(简化版)。

图源:Kimi

秘塔给出的解答,相对来说是更接近Perplexity的,并给予当前关系下两人的精细分析(相同及相左政见、商业合作等)。信源上来看,与Kimi不会相差太多,但分析的精细度却高了不少。

图源:秘塔

天工的表现算不上多好,内容信息量与Kimi相差不多,参考内容8篇,且全是国内文章,大部分为营销文。

图源:天工

别问为什么没问小红书,真的没什么正经的,基本是榜一大哥、收养关系等调侃、玩梗内容。

诺贝尔文学奖:给个好评啊亲
前面两个话题,一个纯娱乐话题,另一个虽然偏政治但社会影响力很强,也有一定的娱乐性。如果换成更严肃的话题,AI搜索是否可以带来更多的惊喜?

这一次,我们问:如何评价今年诺贝尔文学奖(How to evaluate this year's Nobel Prize in Literature)?

先说结论,Kimi、秘塔、天工的回答基本无差别,是典型的夸夸党(信源基本为国内),从国际影响力、文学成就、翻译重要性、东亚女性胜利等角度出发。不过秘塔比较好的一点是,在回答的边上还有提纲,可以让人快速get信息。

Perplexity则在夸的同时,提到了不一样的声音和争议性。

图源:Kimi
图源:秘塔

图源:天工

图源:Perplexity

另外,我也追问各大AI搜索工具一些问题。天工、Perplexity都可以在上一个问题后,延续性回答问题;Kimi需要一定的技巧去问,不然容易重开地图;秘塔则毫无存档,又是全新问题。

天工:高丝模糊的追问,还是能回到话题本身

Perplexity:+1

Kimi:问了,但没懂,那就重新回答

秘塔:你问了一个全新问题,我当然给一个新的回答

多款产品体验下来,广告是真的没广告了,且都能给到一定解答。只是信息的准确度仍有待商榷,尤其是娱乐相关,很容易造成AI幻觉。


发现未来独角兽,项目BP发过来!

如果你的项目足够优秀,希望得到36氪浙江的报道,参加36氪浙江的“未来独角兽活动”,请将你的需求和BP发至36氪浙江项目征集邮箱:zhejiang@36kr.com,我们会及时回复。 

36氪浙江——让浙江创业者先看到未来 !



了解更多


融资首发:上海立芯|冠骋信息|螣龙安科|奕力电磁|先楫半导体|产链朵朵校友圈 霞智科技ROSIWIT 昂科技术|比博斯特|芯材电路

热点观察:医疗大模型舟山宁波港智慧农业|跨年经济临空经济户外产业直播电商&实体济|浙江城乡收入差距|莲花健康|车商造手机|新能源|养生赛道

星际赛第二季:地卫二|椭圆时空|遨天科技|四象科技|英诺天使|东方空间|复旦大学陈宏宇|蓝箭航天|浙商创投

寻找2024上扬线:开篇|新能源|跨境电商|服饰品牌|宠物经济|国货护肤|自动驾驶|芯片|视觉智能


 来个“分享、点赞、在看

36氪浙江
以浙江为核心,为投资者、创业者以及科技、财经从业者提供新锐深度的商业报道,让一部分人先看到未来。
 最新文章