科学家：为什么预测式AI永远无法成功

文摘 2024-11-27 13:01 北京

文 | 徐牧心

19世纪末，一种名为蛇油的保健品在美国出现，号称自己包治百病，延年益寿，因此风靡一时。

这种所谓神药，在中国也有本土化的版本。电影《钢的琴》中就有这样一句台词，形容假药贩子的行径：两斤炉果（一种东北饼干）兑一片扑热息痛，用破胶囊壳子装起来。撑不死人，也药不死人。

而今，两位硅谷计算机科学家，Arvind Narayanan和Sayash Kapoor认为当代人工智能领域，正充斥着大量蛇油假药。而这不仅仅是硅谷的问题，国内也有大量公司在ChatGPT引爆热点后，迅速转身并宣称自己是个“AI公司”，实则其AI的部分少得可怜，甚至纯粹是由实习生们代替。

这不仅对投资人的回报收益是有害的，正如假药会销往寻常百姓家，这种AI蛇油也会对所有用户产生影响，甚至困在这种“假药系统”中。

在这本《人工智能蛇油：AI能做什么、不能做什么以及如何区分（AI Snake Oil: What Artificial Intelligence Can Do, What It Can’t, and How to Tell the Difference）》中，两位作者研究了五十项AI应用，发现在预测式AI应用中假药横行，这些应用已经暴露出很多缺陷，并且根据其运行逻辑，它们永远也不可能达到其声称的效果。

《人工智能蛇油：AI能做什么、不能做什么以及如何区分》，普林斯顿大学出版社

预测式AI和生成式AI不同，后者包括以ChatGPT为代表的生成文字、文生图、文生视频等。预测式AI则涵盖法律、医疗、金融、教育等诸多民生领域，比如AI招聘、AI面试、AI评估保险理赔等。

以下是「暗涌waves」的摘录——

1. 在美国，约有四分之三的雇主使用AI工具进行招聘，包括AI简历筛选、AI视频面试等，求职者们在发现这件事情后，便使用了一系列反制措施。求职者可以在简历中加入一些厉害的关键词，比如“哈佛毕业”、“十年工作经验”、“带领过百人团队”等等，再用白字添加进简历中——人类看不到的白字，却能被电脑识别到。

记者在调查后发现，在AI视频面试中，一个人只需要戴上围巾或眼镜就可以大幅改变AI的评分，这些措施包括在背景中放一个书架、让视频变暗，或者仅仅是将简历格式从PDF改为纯文本。

2. 2022年夏天，多伦多利用人工智能工具预测公共海滩的细菌含量，以此来决定何时开放或关闭海滩。事实却证明，该工具的失败率高达64%，也就是说你有六成的可能进入细菌海域游泳。政府在对此进行回应时的策略是：预测工具只是辅助，人工监督员会做出最终决定，但经记者调查后发现，监督员从未改变过AI的决定。

3. 在美国，65岁以上的老人可以加入国家补贴医保。但保险公司为了降低成本，开始使用人工智能来预测病人需要的住院时间。这个初衷很好理解，因为如果没有这套系统，医院理论上会想让病人住得越久越好，以此获取更多收益。但在一个案例中，一位75岁的老人被评估为可以在17天内出院，所以尽管她此时仍无法独立行走，但根据人工智能的评估结果，还是被赶出了医院。

4. 保险公司Allstate想提高自己的保险费率，所以利用人工智能来进行测算，找出有多少客户可以接受保险费提高而不会流失，结果却是人工智能拿出了一份“笨蛋名单”，其中大部分是62岁以上的老人，这是因为老人不太可能货比三家。

5. 宾夕法尼亚洲曾采用一种“家庭筛查工具”来预测哪些儿童会面临虐待风险，如果结果显示该儿童很可能正在被家庭虐待，社工可以选择直接带走小孩，将它安置在寄养家庭中。

但这个工具的问题是，其数据集使用的是公共福利数据，但并不包括使用私人保险的人，简而言之，用这些数据建立模型无法对富裕阶层作出预测。

6. 数据集是预测式人工智能的核心。但我们也知道，随着样本噪声的增加，创建精确模型所需的样本数量也会急剧增加。而社会数据集的噪声很大，社会现象的基本模式并不固定，它们在不同的环境、时间和地点会有很大的不同。因此在某一时间地点被识别成功的模式，只要稍稍改变一个参数，就完全没有参考价值了。

7. 此前作者发起了挑战赛：使用每个孩子约一万条社会学相关数据，来预测这些孩子的学习成绩是否会提升，结果失败得很彻底。后续我们复盘的时候，发现有很多和学习成绩这个结果直接相关的数据，是不可能被记录进数据集的。比如一个孩子学习成绩突然提高，是因为邻居给他蓝莓吃，还帮他做作业，这种家庭之外的影响也很重要。

8. 所以，为什么要有预测式AI的出现？一个主要原因是我们实在太厌恶随机性。很多心理学实验都证明了这点，我们甚至会幻想自己可以预测那些事实上是随机出现的事物。

但用人工智能预测只会让我们离想要的未来更远。毕竟大部分人都不会期待一个预测成功率极其有限，却会让弱者遭受系统性歧视的未来。

参考文献：

[1]Arvind Narayanan、Sayash Kapoor，AI Snake Oil: What Artificial Intelligence Can Do, What It Can’t, and How to Tell the Difference

图片来源｜《钢的琴》剧照

往期推荐

蚂蚁大模型推理之显存优化探索实践

斯坦福大学教授李飞飞团队：关于 2024 年人工智能发展报告总结

滴滴ChatBI技术实践：智能数据分析的前沿探索与应用

谷歌科学家万字长文：《改变你职业生涯的一篇文章，我如何运用人工智能完成工作》建议每个人都要读一遍

火山引擎基于大模型 ChatBI 的演进与实践

AI改变工作：一天内打造专属于你自己的RAG

多智能体系统（OpenAI Swarm）的可观测性研究实践

京东数据架构解析：供应链效率提升与决策优化策略

吴恩达最新观点：LLM的下一个新兴方向是Agentic AI

大模型时代下的私有数据安全与利用

点个在看你最好看

SPRING HAS ARRIVED

http://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247753560&idx=2&sn=6314ab8eba96b3abf1fa089b8e23fa41

DataFunTalk

专注于大数据、人工智能技术应用的分享与交流。致力于成就百万数据科学家。定期组织技术分享直播，并整理大数据、推荐/搜索算法、广告算法、NLP 自然语言处理算法、智能风控、自动驾驶、机器学习/深度学习等技术应用文章。

最新文章

观远数据ChatBI：加速数据驱动的敏捷决策实践

豆包 MarsCode 落地编程助手场景的探索实践

内含福利 | StarRocks 2024年度技术峰会，与30+全球企业共探湖仓技术创新

B站Airflow作业迁移调度系统实践

免费领 |《数据智能知识地图》实体版

数智汽车行业峰会、AI基础软件架构峰会招募内容整理志愿者！

GraphRAG在车企的创新应用实践

从 ETL 到 NoETL 的数据架构演进——Denodo 的创新解决方案

魔乐社区大模型应用速通指南

中小微企业B2B跨境贸易风控实践

免费领 |《数据智能知识地图》实体版

数智汽车行业峰会、AI基础软件架构峰会招募内容整理志愿者！

B站大数据任务基于Volcano的云原生调度实践

12 月 14 日，Doris Summit Asia 2024 议程正式公开，线下报名现已启动！

科学家：为什么预测式AI永远无法成功

免费领 |《数据智能知识地图》实体版

数智汽车行业峰会、AI基础软件架构峰会招募内容整理志愿者！

蔚来汽车RAG在智能化领域的创新应用

Flink 2.0：史上最大更新解读

国产大模型推理引擎思考和实践

电子书上新 |《Data for AI 实践之路：从数据治理到智能应用》

数智汽车行业峰会、AI基础软件架构峰会招募内容整理志愿者！

蚂蚁大模型推理之显存优化探索实践

从大数据到大模型：现代应用的数据范式

斯坦福大学教授李飞飞团队：关于 2024 年人工智能发展报告总结

车企ChatBI如何高效落地

免费领 |《数据智能知识地图》实体版

滴滴ChatBI技术实践：智能数据分析的前沿探索与应用

B 站云原生场景大数据资源超配框架搭建实践

免费领 |《数据智能知识地图》实体版

数智汽车行业峰会、AI基础软件架构峰会招募内容整理志愿者！

谷歌科学家万字长文：《改变你职业生涯的一篇文章，我如何运用人工智能完成工作》建议每个人都要读一遍

汽车行业企业级知识平台系统搭建技术实践

车企ChatBI如何高效落地｜知识图谱实体版免费领取

免费领 |《数据智能知识地图》实体版

数智汽车行业峰会、AI基础软件架构峰会招募内容整理志愿者！

MNN在端侧大模型部署上的探索实践｜知识图谱实体版免费领取

火山引擎基于大模型 ChatBI 的演进与实践

大模型高效训练一体框架LLaMA Factory技术实践

华为AIGC研发新范式

免费领 |《数据智能知识地图》实体版

数智汽车行业峰会、AI基础软件架构峰会招募内容整理志愿者！

全场景开源大模型资源免费用

探索更快速的GPU训练的分布式缓存技术

AI改变工作：一天内打造专属于你自己的RAG

唯品会异构资源池任务编排实践

免费领 |《数据智能知识地图》实体版

数智汽车行业峰会、AI基础软件架构峰会招募内容整理志愿者！

多智能体系统（OpenAI Swarm）的可观测性研究实践

京东数据架构解析：供应链效率提升与决策优化策略

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉