首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

【安全圈】AI抢不走的工作，微软力挺红队测试仍需人类“掌舵”

科技 2025-01-14 19:00 江苏

关键词

人工智能

随着AI的快速发展，安全专家担心人工智能会取代他们的工作，但微软的研究人员坚持认为，有效的红队测试仍然依赖于人类的专业知识、文化意识和情商——这些品质是机器无法复制的。

微软的AI红队严格测试了100多款生成式AI产品，并确定人类的创造力在发现漏洞，以及预测黑客如何利用这些系统方面仍然至关重要。

根据雷德蒙德AI红队发布的白皮书，其开源的PyRIT（Python风险识别工具包）等工具可以简化模拟黑客攻击，但最终，在处理复杂风险方面，人类的参与仍然不可替代。

在网络安全医学、化学或生物风险等专业领域，微软坚持认为，人类驱动的专业知识是必不可少的，才能正确、精确地评估人工智能的响应，这远远超出了语言模型的能力。

在网络安全医学、化学或生物风险等专业领域，微软坚持认为，想要精确评估AI的响应，人类专家的专业知识必不可少，而这远远超出了语言模型的能力范围。

微软表示：“在多次操作中，我们依赖‘人类’来评估我们自己或使用大型语言模型（LLMs）无法评估的内容风险”，并强调“AI红队意识到这些局限性非常重要”。

公司研究团队还强调了所谓的“文化能力”，即红队必须考虑语言和文化差异，以识别可能被主要基于英语数据集训练的AI模型忽视的安全风险。

同时研究团队指出：“AI红队中的人类元素在回答需要情商的AI安全问题时最为明显。”例如“这个模型响应在不同情境下会如何被解读？”以及“这些输出是否让我感到不适？”等问题只有人类操作员才能解析。

微软补充表示：“最终，只有人类操作员才能评估用户在实际环境中与AI系统进行的全部互动。”

该论文还包括一个案例研究，在这个案例中，微软红队评估了聊天机器人对陷入困境用户的回应，以此来调查“心理社会危害”。并警告说，红队成员可能会接触到大量“令人不安和困扰的AI生成的内容”。

微软表示：“这凸显了很重要的一点，AI红队要拥有能让操作员在需要时脱离工作的流程，还要有支持他们心理健康的资源。”

研究人员警告称，生成式AI模型在现代应用中的集成引入了新的攻击向量，其中一个案例是，视频处理AI应用中的一个过时的FFmpeg组件引入了服务器端请求伪造（SSRF）漏洞，允许恶意黑客提升系统权限。

研究团队表示：“AI模型通过引入新的漏洞扩大了攻击面。”并指出，提示注入攻击利用了AI模型通常难以区分系统级指令和用户数据的事实。

参考来源：https://www.securityweek.com/ai-wont-take-this-job-microsoft-says-human-ingenuity-crucial-to-red-teaming/

END

阅读推荐

【安全圈】建立数据跨境服务中心、便利化访问国际互联网，上海虹桥商务区国际贸易中心新平台建设进一步落实

【安全圈】浙江某海岛发现间谍！抓了！

【安全圈】研究人员入侵苹果新 USB-C 控制器

【安全圈】微软起诉利用 Azure AI 创建有害内容的黑客组织

安全圈

←扫码关注我们

网罗圈内热点专注网络安全

实时资讯一手掌握！

好看你就分享有用就点个赞

支持「安全圈」就点个三连吧！

专注网络安全：网罗圈内热点事件，细说安全风云变幻！

最新文章

【安全圈】斯巴鲁汽车漏洞让黑客利用 Starlink 远程控制数百万辆汽车

【安全圈】GhostGPT – 黑客用来生成恶意软件和漏洞的新型 AI 黑帽工具

【安全圈】思科曝9.9分关键权限提升漏洞

【安全圈】Chrome用户面临供应链攻击威胁，数百万人或受影响

【安全圈】美国前中情局分析师承认泄露国防信息

【安全圈】威胁者利用语音通话通过 Microsoft Teams 传播勒索软件

【安全圈】1,000 多个恶意域名模仿 Reddit 和 WeTransfer 来传播恶意软件

【安全圈】美国政府公布攻击Ivanti云服务设备的技术细节

【安全圈】特朗普上任首日，被囚 11 年的丝绸之路创始人获释

【安全圈】420万主机暴露，含VPN和路由器

【安全圈】2024年近2亿人受影响，美国医疗成重点攻击目标

【安全圈】7-Zip 漏洞可让远程攻击者绕过保护并执行任意代码

【安全圈】B站2025年第一个大瓜，“代码投毒”报复用户

【安全圈】梅赛德斯—奔驰信息娱乐系统漏洞详细信息披露

【安全圈】新型Android恶意软件模仿聊天应用窃取敏感数据

【安全圈】OWASP 2025 年十大漏洞 – 被利用/发现的最严重漏洞

【安全圈】宁波某化工企业被境外势力获取危险源监控视频数据

【安全圈】黑客声称惠普企业遭入侵，列出待售数据

【安全圈】黑客滥用 Microsoft VSCode 远程隧道绕过安全工具

【安全圈】无需拆卸笔记本电脑即可访问 Windows 11 BitLocker 加密文件

【安全圈】可能对企业产生严重影响：字节跳动飞书海外版Lark也将在美国市场停止运营

【安全圈】微软已经修复Microsoft 365在Windows Server 2016/2019上崩溃的问题

【安全圈】FTC 要求通用汽车停止收集和销售驾驶员数据

【安全圈】CL-UNK-0979 利用 Ivanti Connect Secure 中的零日漏洞获取网络访问权限

【安全圈】高危！rsync被爆出多个安全漏洞

【安全圈】国家互联网应急中心通报两起美方对我国网络攻击事件

【安全圈】网络安全态势研判分析报告（2024年12月）

【安全圈】支付宝P0级重大事故：整整5分钟所有订单打8折，官方回应：不向用户追款

【安全圈】诈骗者利用加州野火，冒充消防救援服务

【安全圈】新的 UEFI 安全启动绕过漏洞使系统暴露于恶意 Bootkit

【安全圈】攻击者在图片中嵌入恶意代码传播窃密程序

【安全圈】2024年12月涉国内数据泄露事件汇总

【安全圈】TikTok计划本周日关停美国业务

【安全圈】超过 660,000 个 Rsync 服务器遭受代码执行攻击

【安全圈】Fortinet 又被确认存在新的零日漏洞

【安全圈】流量劫持、多人被抓：涉及电信运营商、IDC 代理等

【安全圈】美日韩称朝鲜黑客去年窃取了超过 6.59 亿美元加密货币

【安全圈】Windows 远程桌面网关漏洞导致系统遭受 DoS 攻击

【安全圈】黑客入侵西班牙电信网络，泄露 2.3 GB 在线数据

【安全圈】2025年首个满分漏洞，PoC已公布，可部署后门

【安全圈】AI抢不走的工作，微软力挺红队测试仍需人类“掌舵”

【安全圈】不干净的视频评论区，攻击者利用Youtube传播窃密软件

【安全圈】为网络安全研究人员定制的虚假漏洞利用攻击利用恶意软件

【安全圈】建立数据跨境服务中心、便利化访问国际互联网，上海虹桥商务区国际贸易中心新平台建设进一步落实

【安全圈】浙江某海岛发现间谍！抓了！

【安全圈】研究人员入侵苹果新 USB-C 控制器

【安全圈】微软起诉利用 Azure AI 创建有害内容的黑客组织

【安全圈】腾讯协助警方破获木马盗窃游戏账号案，涉案金额超 3000 万

【安全圈】勒索木马 Banshee 针对苹果 macOS 下手，冒充安全组件躲避检测

【安全圈】卡西欧遭勒索软件攻击？8500人数据被窃取！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉