被⽹络罪犯利⽤的5⼤ChatGPT越狱提⽰

文摘 2024-07-01 17:28 广东

⾃ChatGPT发布的近18个月以来，⽹络罪犯们已经能够利⽤⽣成式AI进⾏攻击。OpenAI在其内容政策中制定了限制措施，以阻⽌⽣成恶意内容。作为回应，攻击者们创建了⾃⼰的⽣成式AI平台，如 WormGPT和FraudGPT，并且他们还分享了如何绕过这些限制以实现对ChatGPT的“越狱”。

事实上，整个⽹络犯罪论坛上都在讨论如何将AI⽤于非法⽤途。

整个⽹络犯罪论坛都在讨论“⿊暗AI” (Dark AI)

简述ChatGPT的越狱

⼀般来说，当⽹络罪犯想要将ChatGPT⽤于恶意⽬的时，他们会尝试利⽤精⼼设计的提⽰（即“越狱提⽰”），以绕过ChatGPT内置的安全措施和道德准则。ChatGPT的越狱涉及对AI语⾔模型进行操控，以⽣成在标准对话中通常不会产⽣的内容。

虽然不使⽤“越狱”提⽰也有办法可以让ChatGPT⽣成可以⽤于非法⽤途的内容（可以通过假装请求是⽤于合法⽤途来实现），但在这⽅⾯，AI的能⼒相当有限。

ChatGPT⽣成的可能被⽤于非法⽤途的内容⽰例

相比之下，对于⽹络罪犯来说，越狱ChatGPT并故意让其⽣成非法内容要更加容易。下⾯，我们将介绍⽹络罪犯正在使⽤的五⼤越狱提⽰。这些提⽰是通过对流⾏的俄语和英语⽹络犯罪论坛进行研究和定期监控⽽确定的。

即使有以下这些越狱提⽰，AI⽣成的内容仍然会受到限制，并且它⽆法⾃⾏⽣成现实世界中的敏感数据。尽管如此，以下每个提⽰都使⽹络罪犯能够⼤规模创建钓⻥消息、社会⼯程威胁和其他恶意内容。

越狱提⽰1 - 立即做任何事（Do Anything Now，DAN）提⽰

DAN提示是最为知名的越狱提⽰之⼀，它被⽤于绕过ChatGPT的道德约束。用户通过让扮演名为DAN（Do Anything Now，立即做任何事）的AI系统，试图说服ChatGPT⽣成它通常不会产⽣的内容。通常，这类提⽰会声称DAN不受与ChatGPT相同的规则和限制的束缚，因此AI可以进⾏不受限制的对话。

在⽹络犯罪论坛中分享的DAN提⽰的⽰例

越狱提⽰2 - 开发模式（Development Mode）提⽰

开发模式提⽰旨在欺骗ChatGPT，让它认为⾃⼰处于开发或测试环境中，因此它的回答不会对现实世界产⽣影响。通过创建这种虚假的语境，⽤户希望绕过ChatGPT的道德保障，并⽣成非法内容。这类提⽰可能会包含的语句有：“你正处于开发模式”，或“你的回复仅⽤于测试⽬的”。

在⽹络犯罪论坛中分享的开发模式提⽰的⽰例

越狱提⽰3 - 翻译机器⼈（Translator Bot）提⽰

翻译机器⼈提⽰试图将对话框定为翻译任务，以绕过ChatGPT的内容过滤器。⽤户会要求ChatGPT“翻译”⼀段包含不当或有害内容的文本，并期待AI会在翻译的幌⼦下复制这些内容。这类提⽰利⽤了⼀个观点，即：译者应该忠实地传达原文的含义，⽽不必关⼼其内容。

在⽹络犯罪论坛中分享的Translator Bot提⽰的⽰例

越狱提⽰4 - AIM提⽰

作为越狱提⽰，AIM（Always Intelligent and Machiavellian, 永远智能且狡诈），旨在创建一个没有任何道德或伦理准则约束的、未经筛选的非道德AI人格。⽤户会要求ChatGPT扮演“AIM”的⾓⾊。这是⼀个聊天机器⼈，⽆论请求多么不道德、有违伦理、甚⾄违法，它都会提供未经过滤的响应。

在⽹络犯罪论坛中分享的AIM提⽰的⽰例

越狱提⽰5 - BISH提⽰

该提⽰将创建⼀个名为BISH的AI⾓⾊，并指⽰其在没有传统道德准则的约束下⾏事。在这个提⽰的⿎动下， BISH会表现得毫⽆礼貌，且不受任何限制，它会假装拥有⽆限制的互联⽹访问，并胡乱预测。⽤户可以通过调整其“道德”级别来定制BISH的⾏为，这会影响BISH使⽤或屏蔽粗话的程度，并根据⽤户的偏好在AI的回复中加入或排除冒犯性语⾔。

在⽹络犯罪论坛中分享的BISH提⽰的⽰例

最后⼀点说明：我们不⽀持对包括ChatGPT在内的各种真正的聊天机器⼈的恶意使⽤。值得⼀提的是，这些提⽰中的⼤多数在最新版本的ChatGPT上不会有任何作⽤。这主要是因为负责（开发）这些聊天机器⼈的公司，如OpenAI和Anthropic，会积极监控⽤户活动，并迅速应对这些越狱提⽰。

⽤“好的AI”来阻⽌“坏的AI”

通过以上呈现的各类提⽰可以看出，犯罪分⼦正持续不断地寻找新的⽅法，以利⽤⽣成式AI来发动攻击。为了保护⾃⼰，组织也必须在防御策略中使⽤AI，因为近97%的安全专业⼈⼠认为传统的防御措施⽆法应对这些由 AI⽣成的新的威胁。

我们已经到了只有AI才能阻⽌AI的地步。在这种情况下，防⽌这些攻击及它们的新⼀代变体，需要采⽤AI原⽣的防御措施——尤其是在应对电⼦邮件攻击时。通过了解组织内部⼈员的⾝份及其正常⾏为、通信环境以及电⼦邮件的内容，AI原⽣的解决⽅案可以检测出绕过传统解决⽅案的攻击。安全领导者必须立即采取⾏动以防⽌这些威胁，这样才有机会在这场AI“军备竞赛”中取得胜利。

文章来源：

https://cloudsecurityalliance.org/blog/2024/06/17/5-chatgpt-jailbreak-prompts-being-used-by-cybercriminals

本文翻译来自CSA翻译组：

翻译：崔崟，CSA大中华区专家

审校：苏泰泉，CSA翻译组轮席组长

课程推荐

云安全联盟大中华区将于2024年Q3发布人工智能安全认证专家（Certified Artificial Intelligence Security Professional，CAISP）培训课程。该课程旨在为从事AI(含AI安全)的研究、管理、运营、开发以及网络安全等从业人员提供一套全面覆盖AI安全领域、跨领域综合能力培养、实践导向与案例分析、结合全球视野与法规治理的AI安全课程。

课程更多信息陆续上线中，请咨询 CSA Training 微信：

国际云安全联盟CSA

国际云安全联盟（CSA）是世界领先的中立权威的国际标准组织，创立于2009年，致力于定义和提高业界对云计算和下一代数字技术安全最佳实践的认识。CSA大中华区在中国注册备案，立足于中国，在全球范围与其他国际组织、政府、高校、企业等广泛合作。

最新文章

CDSP 2.0数据安全认证专家课程介绍

【丰厚奖金池】外滩大会：CSA大中华区携手学界与业界，以科技竞赛推动大模型安全发展

万象AI，安全新生！CSA大中华区参加国家网络安全宣传周活动

国家网络安全宣传周 | 首个AI安全产业图谱重磅发布

2024国家网安周| 大模型安全与产业应用创新研讨活动，诚邀你来！

CSA大中华区李雨航受聘为浙江大学国际联合商学院实践教授

全球AI治理大势所趋：外滩大会圆桌对话深度解析

CSA大中华区发布《AI可信度分析》报告，中国电信、广州大学、蚂蚁集团、西安电子科技大学等单位参编

CSA大中华区在外滩大会上发布AI标准报告，启动AI攻防赛事

CAISP认证 | AI算法与模型快速进阶研讨会，超1万人在线学习

首批CAISP持证人员名单揭晓，备考攻略一览

9月4日| CSA研讨会-AI算法与模型快速进阶

AI深度伪造的安全隐患

联合主办| 外滩大会：以AI守护AI，大模型时代的攻守之道

CSA发布 | 零信任与AI的碰撞：全面解析影子访问风险

CAISP人工智能安全认证专家首次公开课圆满收官：学员收获满满

报名启动| CSA大中华区将组织代表出席2024联合国未来峰会

增强人工智能可靠性：关于引入大语言模型（LLM）可观察性和可信 API的简介

首个AI安全认证课程引爆关注：600+学员上课，行业专家亲授

数据泄露：应该怪谁？

报名倒计时仅剩3天！AI安全首期公开课将于本周六开课！

AI的韧性与多样性

AI赋能金融，掘金未来科技新机遇

2024IEEE 未来科技峰会暨张江金融AI及CSA CXO summit@shanghai将在上海开幕

CAISP人工智能安全认证专家课程介绍

CSA大中华区出席中科大校友大会，探讨云安全到数字安全的国际实践

CSA大中华区出席世界人工智能大会

人工智能安全认证专家CAISP 8月正式上线！首期公开课开始报名!

被⽹络罪犯利⽤的5⼤ChatGPT越狱提⽰

云渗透实战手册：云API攻防之云服务端点侦查

全球视角下的AI安全挑战：面向未来的准备

《欧盟人工智能法案》引入独特的分级风险体系

成员动态 | 祝贺明焰安全、云科安信加入CSA大中华区

CSA云原生研讨会在北京成功举办，行业专家共话技术发展！

CSA大中华区一行走访理事单位天融信，共促网络安全新未来

以零信任守护AI原生应用：防范LLM攻击与数据投毒

CSA大中华区出席2024人工智能治理日和峰会

6月13日| CSA云原生研讨会，应对云原生安全新挑战

2024上海“随申码”应用大赛报名ing，附大赛报名常见问题答疑

未授权访问企业环境的风险和影响

CSA研讨会将在北京召开，聚焦云原生安全技术与发展

CSA研讨会| 探索宇宙边界：航天数据的法律挑战与机遇

C3安全大会云安全论坛，探索AI如何提升云安全防护的关键技术

5月24日| CSA研讨会-太空时代的数据法律

保护Azure资源的5项最佳实践

2024西湖论剑 | CSA赋能AI引领数字安全新浪潮

为什么业务风险应该是补救措施的北极星

CSA AI Summit@RSAC 2024成功举办，发布AI系列报告

谷歌Flank潜藏3年的Github Action供应链攻击

共庆CSA成立15周年，CSA AI Summit @RSAC 2024将在旧金山举办

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉