热搜第一!13.8和13.11到底哪个大?

企业   广告创意   2024-07-18 12:34   北京  
写在前面:

大家好,我是转转。

13.8和13.11,到底哪个大?

这个问题,对小学生来说可能刚刚好,但是对网友和以“智能”著称的各大AI模型,就显得有些复杂了。


一场歌手比赛,数学老师气笑了


今年的《歌手2024》,可以说是争议不断。不仅由那英老师贡献了无数表情包:



我们变美了的孙男老师,更是在数学界掀起了波澜。


上周末最新一期《歌手》中,孙楠取得了竞演的第五名。但节目中公布的他和香缇莫的得票率——13.8%和13.11%,却成为了比他们的表演更热门的话题。



不少网友争论起,这两个数字究竟谁更大,谁更小。



不过,在转转的用户里,这个问题应该没什么争议。毕竟,来转转买官方验的朋友,都是最会精打细算,精挑细选的!



网友弄不清?AI更不行!


不光是不少网友一时糊涂,就连一众海内外AI大模型,都被难倒了。


第一财经、财联社等媒体用这个问题,对市面上的知名AI大模型进行了测试,ChatGPT、Kimi、智谱清言、商汤商量、阶跃星辰等大部分大模型应用都给出了错误答案,只有文心一言、豆包等少部分大模型为AI守住了些脸面。


知名度最高的ChatGPT直接就是一个已读乱回:



kimi答错了后被质疑,甚至还卖起萌:



有意思的是,转转专门测试了一下——


这个话题上热搜后,各大模型紧急修复了这个bug,不过只要略施小计换一个数字,这些AI就又原形毕露了:



看来,AI即将代替人类的恐怖传说,一时半会儿还不会照进现实。


AI差点事,还得靠真人!

在业界,这种大模型算不明白数、说胡话的现象,被称为大模型出现幻觉。此前,哈尔滨工业大学和华为的研究团队发表的综述论文认为,模型产生幻觉的三大来源,是数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。

而目前,这种大模型出现幻觉的情况还较为普遍,这也是AI无法在更多领域进行进一步应用的原因。

目前,转转在全国设立了三大智能质检中心,通过先进的智能设备大大地提高验机效率。但同时,我们也拥有2000名真人验机师,对每一台官方验机器进行严格质检,生成一份专属的质检报告,详细地记录了这件商品的每一项功能与细节,保障每一名用户的购物体验。


我们的绝大多数官方验产品,还为大家提供7天无理由退货365天平台质保服务,二手也能有售后,让你买得更放心!


希望在未来,我们可以将更多先进的科技应用到我们的质检环节中,让更多人轻松地参与到二手交易中,一起用二手拯救世界!


欢迎在评论区一起讨论:13.8和13.11,到底哪个大? 



转转
转转是一个二手物品闲置交易平台,提供信息发布、支付功能以及担保交易,只需花很少的钱,就能过上有品质的生活!
 最新文章