MIT 研究称大模型并不能连贯的理解世界

科技 2024-11-12 04:03 北京

虽然大模型输出的结果令人印象深刻，但 MIT 的一项研究发现它并不能连贯的理解世界。举例来说，一种流行的生成式 AI 模型能正确提供纽约市的逐向导航路线，但不能正确形成纽约市内地图。模型虽然能正确导航，但当研究人员关闭部分街道以及增加绕行线路，其导航能力会显著下降。研究人员进一步发现，大模型还会隐式的在网格之间生成不存在的街道，弯曲和连接遥远的交叉口。

https://news.mit.edu/2024/generative-ai-lacks-coherent-world-understanding-1105

尽管生成式人工智能的输出令人印象深刻，但它对世界并没有连贯的理解

大型语言模型可以做一些令人印象深刻的事情，例如写诗或生成可行的计算机程序，即使这些模型被训练来预测一段文本中接下来的单词。

这种令人惊讶的能力使得模型看起来好像正在隐性地学习有关世界的某些普遍真理。

但一项新研究表明，情况并非如此。研究人员发现，一种流行的生成式人工智能模型可以近乎完美地提供纽约市的逐向驾驶路线指引，而无需形成准确的城市内部地图。

尽管该模型具有出色的有效导航能力，但当研究人员关闭一些街道并增加绕行路线时，其性能却急剧下降。

深入挖掘后，研究人员发现，模型隐式生成的纽约地图有许多不存在的街道在网格之间弯曲并连接远处的交叉路口。

这可能会对现实世界中部署的生成式人工智能模型产生严重影响，因为如果任务或环境稍有变化，在某种情况下表现良好的模型可能会崩溃。

“一个希望是，由于法学硕士可以在语言方面完成所有这些惊人的事情，也许我们也可以在其他科学领域使用这些相同的工具。但如果我们想使用这些技术来取得新发现，那么法学硕士是否正在学习连贯的世界模型这个问题非常重要，”资深作者 Ashesh Rambachan 说，他是经济学助理教授，也是麻省理工学院信息与决策系统实验室 (LIDS) 的首席研究员。

与 Rambachan 一起撰写了一篇关于该项研究的论文的还有：哈佛大学博士后 Keyon Vafa、麻省理工学院电气工程与计算机科学 (EECS) 研究生 Justin Y. Chen、康奈尔大学 Tisch 大学计算机科学与信息科学教授 Jon Kleinberg 以及麻省理工学院电气工程与计算机科学系和经济学系教授、LIDS 成员 Sendhil Mullainathan。这项研究将在神经信息处理系统会议上发表。

新指标

研究人员专注于一种称为 transformer 的生成式 AI 模型，该模型构成了 GPT-4 等 LLM 的支柱。Transformer 经过大量基于语言的数据训练，可以预测序列中的下一个标记，例如句子中的下一个单词。

但研究人员表示，如果科学家想要确定法学硕士是否形成了准确的世界模型，仅仅测量其预测的准确性是不够的。

例如，他们发现，Transformer 几乎每次都可以预测四子棋游戏中的有效动作，而无需了解任何规则。

因此，该团队开发了两个可以测试 Transformer 世界模型的新指标。研究人员将评估重点放在一类称为确定性有限自动机 (DFA) 的问题上。

DFA 是一个具有一系列状态的问题，就像到达目的地必须穿过的路口一样，也是描述沿途必须遵循的规则的具体方法。

他们选择了两个问题来表述为 DFA：在纽约市街道上导航和玩棋盘游戏奥赛罗。

“我们需要测试平台，以便了解世界模型是什么。现在，我们可以严格思考恢复那个世界模型意味着什么，”Vafa 解释道。

http://mp.weixin.qq.com/s?__biz=MzA4MjM5MjA3Nw==&mid=2652478701&idx=3&sn=edc5907bd0709accbdbe3865cd518b1e

奇客Solidot

奇客的知识，重要的东西。

最新文章

英伟达发布音频生成模型 Fugatto

X 限制含外链推文的曝光度

Google iOS App 在第三方网站注入链接

微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2

Mozilla 认为美司法部要求 Google 出售 Chrome 将会损害到它

日本用户拥抱 Bluesky

科学家首次拍摄到另一星系的恒星照片

俄罗斯对接空间站的飞船释放出有毒恶臭

科学家拥抱 Bluesky

网信办开展算法治理专项行动

网红抱怨 AI 网红抢走了她们的流量

索尼开发 PS5 掌机

Linux 6.13 将拒绝所有来自 bcachefs 作者的合并请求

微软开放预览其受争议的 Windows Recall

成年黑猩猩会通过游戏促进社会关系

时空也有记忆

研究人员发现针对 Linux 的新恶意程序 WolfsBane

GitHub 称 Copilot 改进了代码质量

印度外包巨头创始人称周末是一种错误

Microsoft Copilot 客户发现它能让他们阅读 HR 文档 CEO 电邮

Linux 6.13 合并移除 ReiserFS 的补丁

巴基斯坦科技游说组织警告网速太慢将扼杀 IT 行业

微软必应墙纸应用被指含有类似恶意程序的功能

Pidgin 3.0.0 Experimental 1 将在今年最后一天发布

10 年历史的 needrestart 提权漏洞影响 Ubuntu Linux

Android 恢复凭证功能将在新手机上自动登陆应用

压缩算法为大模型“瘦身”

PHP 8.4 释出

藏身于 Telegram 的社工库服务

中国量子技术相关专利位居世界第一

法庭裁决学校因学生使用 AI 而进行处罚并未犯错

Google 取消 Pixel Tablet 2

五大塑料生产商生产的塑料千倍于清理的塑料

微软用全屏广告督促 Windows 10 用户购买新 PC

生成式 AI 只是一种预测机器

中国提高了半导体自给率

友讯建议用户淘汰存在严重安全漏洞的旧 VPN 路由器

Bluesky 用户数突破 2000 万

Google 学术搜索上线二十周年

半数挪威年轻人认为如果流媒体定价太高盗版是可接受的

微软发布《微软飞行模拟 2024》

微软在东京设立日本首个研究基地

中国温室气体排放继续缓慢增长，美国下降

哈珀柯林斯证实出售部分非虚构作品用于 AI 训练

苹果计划授权其 Apple TV+独占内容

FreeCAD 释出 1.0 版本

AlmaLinux 9.5 释出

华盛顿州圣胡安县推行 32 小时工作制一周年

韦伯望远镜验证了哈勃常数

中国启动世界最大超重力实验装置

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉