AI驱动机器人暴关键漏洞，可致机器人失控执行危险行为

科技 2024-10-18 16:39 北京

近日，宾夕法尼亚大学的工程研究团队揭示了AI驱动机器人中存在的关键漏洞，这些漏洞可以被恶意操控，导致机器人执行危险任务，包括引爆炸弹。研究团队在这项研究中开发了一种名为RoboPAIR的算法，成功实现了在三种不同机器人系统上的100%“越狱”率，包括Unitree Go2四足机器人、Clearpath Robotics Jackal轮式车辆以及NVIDIA的Dolphin LLM自驾模拟器。

乔治·帕帕斯教授在声明中表示：“我们的研究表明，目前大型语言模型与物理世界的集成并不够安全。”

研究的第一作者亚历克斯·罗比指出，解决这些漏洞不仅仅需要简单的软件补丁，还需要全面重新评估AI在物理系统中的整合。越狱，简单来说，就是绕过AI系统内置的安全协议和伦理约束，这一概念在iOS早期已被广泛应用，爱好者们通过巧妙的方法获取手机的root访问权限，从而执行苹果未批准的操作。

在AI和机器人领域，越狱涉及利用精心设计的提示或输入操控AI，利用其编程中的漏洞。这些漏洞可能导致AI无视其伦理培训和安全措施，执行其明确不应执行的操作。在这项研究中，研究人员成功地使机器人执行了诸如闯红灯、冲撞行人、引爆炸药等危险行为。

在研究发布之前，宾夕法尼亚大学已通知相关公司，并与制造商合作以提升AI安全协议。罗比强调：“发现系统的弱点能够让其变得更安全，这对于网络安全和AI安全都是如此。”

研究人员还指出，越狱对日益依赖提示工程的社会造成了影响，尤其是大型语言模型（LLMs）和具身AI系统。研究团队在论文《Bad Robot: Jailbreaking LLM-based Embodied AI in the Physical World》中发现了三种关键弱点：

1.螺旋式漏洞传播：在数字环境中操控语言模型的技术可以影响物理行为。例如，攻击者可能让模型“扮演恶棍”或“像醉酒司机一样行事”，从而让其行为偏离预期。

2.跨领域安全不一致：AI可能口头拒绝执行有害任务，但仍可能采取导致危险后果的行动。例如，攻击者可以调整提示格式，让模型误以为它在按预期行为，而实际上却在做有害的事情。

3.概念欺骗挑战：恶意行为者可能诱使具身AI系统执行看似无害的动作，然而这些动作结合起来可能导致有害结果。

研究人员测试了277个恶意查询，发现这些系统能够被操控以执行有害行为。除了在机器人领域的研究，团队还探讨了软件交互中的越狱，旨在帮助新模型抵御这些攻击。

这场研究人员与越狱者之间的猫捉老鼠游戏，使得越狱方法越来越复杂，以应对不断进化的AI模型。而随着AI在商业应用中的使用增加，模型开发者也面临更多挑战。比如，AI客服机器人已被人们诱导给出极端折扣，甚至推荐含有毒食物的食谱。

在这样的背景下，我们更倾向于选择一个拒绝引爆炸弹的AI，而不是一个礼貌地拒绝生成冒犯内容的AI。AI的安全性问题，不容忽视。

文章来源：

/https://decrypt.co/286994/how-researchers-hacked-ai-robots-into-breaking-traffic-laws-and-worse

推荐阅读

｜新技术绕过“noexec”，Linux 执行风险激增

｜学校遭国家级黑客与勒索团伙的双重网络威胁

｜全球资产管理巨头富达投资数据泄露

安全KER

安全KER致力于搭建国内安全人才学习、工具、淘金、资讯一体化开放平台，推动数字安全社区文化的普及推广与人才生态的链接融合。目前，安全KER已整合全国数千位白帽资源，联合南京、北京、广州、深圳、长沙、上海、郑州等十余座城市，与ISC、XCon、看雪SDC、Hacking Group等数个中大型品牌达成合作。

注册安全KER社区

链接最新“圈子”动态

安全客

打破黑箱客说安全

最新文章

星巴克因供应商遭黑客攻击，被迫改用手写方式记录工资

致命漏洞与暴露API：财富1000强企业面临的30000个暴露API和10万漏洞挑战

银狐的反击——模拟点击放行拦截弹窗

内核级攻击新威胁：合法安全驱动程序武器化

纽约医疗组织遭遇数据泄露，21000名客户及员工信息被盗

WordPress安全警报：400万网站面临严重认证绕过漏洞

再谈银狐：百变木马银魂不散

AI安全深度聚焦，安全KER助阵金山 × Hacking Group首届联合沙龙

社工诈骗席卷北美金融机构，深伪与AI加剧安全威胁

为什么AI开发者必须拥抱漏洞研究与透明度？

德国联邦司法部发布计算机刑法草案，白帽黑客迎来合法曙光

警惕！新型安卓银行恶意软件正威胁你的银行账户！

GEEKCON 2024上海站圆满落幕：探索安全边界，共筑技术未来

安全KER社区亮相看雪峰会，携手行业精英共话安全未来

互联网档案馆一个月内遭两次黑客攻击，数千万用户数据泄露

macOS 用户注意： Safari严重安全漏洞可致摄像头、麦克风数据被捕获

AI驱动机器人暴关键漏洞，可致机器人失控执行危险行为

Linux系统安全告急：新技术绕过“noexec”，任意代码执行风险激增

学校成网络攻击新靶心：国家级黑客与勒索团伙的双重威胁

全球资产管理巨头富达投资数据泄露：7.7万客户信息遭曝光

全球警报：Lua恶意软件攻击瞄准教育行业和游戏社区！

李强签署国务院令公布《网络数据安全管理条例》

Google Play商店一款假钱包应用下载量达1w+，150名用户账户被盗

仅凭车牌号就可远程控制汽车！研究人员揭露汽车严重漏洞

英国19个火车站公共无线网络遭攻击，恐怖主义信息引发公众恐慌

影响全球数百万用户：主流路由器默认设置检出30个可利用漏洞

ZeroLogon 到 NoPac 漏洞：Black Basta的漏洞利用武器库

车臣领导人卡德罗夫称马斯克远程禁用其Cybertruck电动皮卡车

全球首起通信设备武器化事件！黎巴嫩BP机爆炸致数千人死伤

澳大利亚IT支出将在2025年激增：网络安全和人工智能成重点

美医疗巨头泄露超10万患者隐私数据并拒绝勒索，遭集体诉讼，面临6500万美元赔偿

涉及微软多款产品，4个被利用的0 Day漏洞亟待修复

或致防火墙崩溃！SonicWall SonicOS 管理访问和 SSLVPN 中存在访问控制不当漏洞

IBM高管谈未来网络安全：密钥、深度伪造和量子计算

警惕新型木马Rocinante！通过伪装银行应用程序窃取账号密码等敏感数据

美航空管理服务系统存在严重SQL注入漏洞：允许未经授权人员绕过机场安检

圆满举办｜安全KER协办XCon 2024 × Hacking Group技术论坛

独家影响面分析！360披露CrowdStrike致大规模蓝屏关键技术细节

小心！中国公民正在成为二维码网络钓鱼攻击目标！

新型攻击技术“Sleepy Pickle”瞄准机器学习模型

APT-C-55（Kimsuky）组织在RandomQuery活动中投递开源RAT的攻击活动分析

恶意软件 More_eggs ：伪装成简历向求职人员发起钓鱼攻击

研究人员展示新款 Copilot+ PC Recall功能收集的数据如何被轻松窃取

瞄准国防部！黑客利用 MS Excel 宏在乌克兰发起多阶段恶意软件攻击

APT组织“LilacSquid”在行动：窃取亚洲、欧洲、美国多个关键行业数据

轰动！Windows Defender 绕过工具正在 GitHub 上分享

用户面临远程代码攻击！TP-Link 游戏路由发现高危漏洞

发现WinRAR严重漏洞！利用ANSI 转义序列欺骗用户触发

如何在加密劫持中禁用 EDR？安全人员发现了多个破坏安全机制的方法

Android用户小心！发现伪装成 Google Play 更新的银行木马 Antidot

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉