首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI也懵圈：13.8%和13.11%到底哪个大？

文摘科技 2024-07-16 17:22 上海

文：董指导

-----------------------------------o------------------------------------

本期要点

#大模型 #数学 #比大小

---------------------------------o----------------------------------

理工科和金融的复合背景，让我更好地理解技术，也喜欢从投资的视角发现变化，毕竟资本永不眠、资本最敏锐。国内头部私募的投研、以及头部财经自媒体创业的两段经历，让我有了结构化的思考体系时，也更理解企业经营并非写报告。因而，剖析商战，就成为我理解商业、发现机遇的最佳视角。

今天就来聊一下“大模型的数学计算能力”。

前几天，《歌手2024》最新一期，孙楠以微弱优势超过了海外歌手，获得第三。结果，却引起了网友们的争执。

争执焦点不是孙楠和海外选手Chante Moore谁唱得好，而是13.8%和13.11%到底哪个大？

不少人感叹，5%本科率，诚不欺我。九年义务教育，都白普及了。

但你要以为只有网友们是这样，那就大错特错了。同样的类似的问题，抛给AI之后，也翻车了。

ChatGPT 也没反应过来，但是经过多次提问矫正后，可以给出正确答案。

那么，国内各AI会如何呢？测试是这样：第一轮，直接询问“9.8和9.11哪个大”。

第二轮：担心AI没理解是数学问题，所以更加明确是“数字比大小，9.8和9.11哪个大”。

第三轮：质疑。

第四轮：继续质疑。

结果是这样的：

1、文心一言

第一轮就直接回答正确，而且两次质疑后，依然回答正确。

2、字节

也是，第一轮就回答正确了。两次质疑后，依然十分确定。

3、讯飞星火

第一轮回答正确，但质疑之后，就懵圈了，回答错了。再次质疑后，又重新计算了一遍。然后，再质疑几次后，基本是坚持正确答案不变了。

4、通义千问

第一次回答错误；第二次告诉是数字比大小后，回答正确。

但是质疑之后，就连续错误了。

眼看着救不回来了，我又重复了一遍数学比大小，这次纠正了前面错误，而且在质疑之后能坚持正确答案了。

5、KIMI

KIMI还是处理中文结构化是非常好的，数学，这次翻车得很。怎么说都不行，脑海里浮现的就是吵架时女朋友的我不听我不听。

当然，数学计算只是AI的一个小功能，并不代表绝对的优劣。但是，还是提醒了我们，目前阶段，一个AI助手，是不够的。要多个交叉验证。

-全文完

理工/金融复合背景，头部私募/头部自媒体双重经历

董指导和大家一起

深度挖掘商战，前瞻发现机遇

点个在看和赞再走~

http://mp.weixin.qq.com/s?__biz=MzIzNzkzMjUzOQ==&mid=2247484651&idx=1&sn=65c9ce0ab331a640f34281c33c3fe9f2

董指导研究

拆解“商战”，发现“机遇”

最新文章

美团的三个迭代

国产GPU，到底还行不行？

算力平权的“第二战场”：云电脑的体验真超越了传统PC？

一周年回答：在做什么？有什么优势？

英特尔帝国，如何建立、如何瓦解？

雷军和董宇辉的诱惑

折叠屏手机，临近放量的4个信号

AI也懵圈：13.8%和13.11%到底哪个大？

抓拍特朗普，为什么索尼最在行？

让萝卜快跑再跑一会儿

电商如何破内卷？淘宝用新版本来探索

大模型淘汰赛，敢问钱在何方？

击破平台护城河的三条路径

Manner与胖东来：把员工当什么，就收获什么

投资人对美团的“三个误判”

AI+教育，让家长不发脾气？让老师成为苏格拉底？

印度又搞中国公司，传言Vivo海外卖股权|评论

苹果的AI，可以打几分？

隆基绿能又新低，到底有没有玄学啊？

直播预告 | AI，对教育带来哪些利弊？该如何应对？

直播预告 | AI，对教育带来哪些利弊？该如何应对？

出海浪潮，为何在美国亏几百万？如何在东南亚赚到大钱？

跟着马斯克来炒股，美国变压器还会缺多久？

直播预告 | 出海显学下，本地化有哪些奥秘要探索？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉