对抗性机器学习中的博弈论

文摘科学 2024-02-27 11:55 中国

作者：李想

封面（图片来自于网络）

研究背景

对抗性（Adversarial）现象在机器学习 (Machine Learning) 系统中已经被广泛观察到，特别是在使用深度神经网络的机器学习模型中，描述了 ML 系统在某些特定情况下可能会产生与人类不一致且难以理解的预测。这种现象对机器学习系统的实际应用构成了严重的安全威胁，当前研究人员开发了几种先进的攻击范式来探索它，主要包括后门攻击（Backdoor Attacks）、权重攻击（Weight Attacks）和对抗性样本（Adversarial Examples）等。对于每个单独的攻击范式，已经开发了各种防御范式，以提高机器学习模型的鲁棒性。然而，由于这些防御范式的独立性和多样性，很难检验机器学习系统针对不同类型攻击的整体鲁棒性。与传统的研究角度不同，本文从数学、经济学和计算机科学的交叉方向切入，讨论基于博弈论的对抗性机器学习（Adversarial Machine Learning）的相关研究。

图1 对抗性机器学习防御方法的分类

研究方法

博弈论为理性参与者之间的策略互动提供了一个研究框架。一般来说，机器学习模型和攻击者之间的关系类似于两人博弈，而在对抗性机器学习问题的建模中，我们有如下几个问题需要解决。

图2 对抗性机器学习

首先，我们需要决定建模博弈的最佳方式。我们可以将对抗性机器学习问题建模为严格竞争的游戏，其中两个玩家具有截然相反的偏好，这意味着一个玩家的收益就是另一个玩家的损失。这种类型的游戏被称为零和游戏，其中总收益始终为零。由于玩家的收益最大化与另一玩家的收益最小化是相同的，因此，在对抗性学习的博弈中，机器学习模型的最优策略问题是攻击者最优策略的对偶问题。除此以外，我们也可以通过假设两个玩家只对最大化自己的收益感兴趣来对博弈进行建模，其中两个玩家不一定具有完全相反的利益。因此，我们的目标是寻找一种均衡状态，让双方都发挥自己的最佳策略。

图3 零和博弈

除了严格的竞技性考虑之外，我们还需要考虑到玩家在博弈中的角色。我们可以通过假设机器学习模型和攻击者同时做出决定来对游戏进行建模，即同时博弈（Simultaneous Game），其中每个玩家在不知道对手正在采取的策略的情况下选择自己的策略。另一方面，肯定存在这样的情况：一个玩家可能领先（Leader），而另一个玩家在了解领导者的策略选择后，通过对领导者采取最佳策略来跟随（Follower），即序贯博弈（Sequential Game）。例如，一旦提供电子邮件服务，垃圾邮件过滤器（机器学习模型）就会被启动。垃圾邮件发送者（攻击者）可以通过发送消息供垃圾邮件过滤器进行标记来研究垃圾邮件过滤器。

图4 序贯博弈

在更现实的环境中，机器学习模型还可能面对多种未知类型的对手。在这种类型的对抗性学习问题中，机器学习模型成为多个追随者的领导者。因此，该博弈被称为单领导者多追随者 (SLMF) 博弈，这将会是一个更复杂的情况。

最后，我们需要解决的问题是博弈最终是否稳定以及博弈是否存在均衡解，从而进行相应的机制设计。

研究结论

目前，博弈论在对抗性机器学习中的研究仍有一定的局限性，例如，在应用博弈论建模对抗性机器学习问题时，我们假设博弈中的玩家会进行理性互动。然而，这种假设在现实生活中不一定成立，特别是在安全领域，人类玩家的行为是高度不可预测的。此外，博弈论建模问题的方法并不总是可行的。在某些情况下，博弈均衡可能不存在；即使存在博弈均衡，均衡的求解也通常会涉及计算上难以解决的问题（如NP-Hard）。综上，博弈论为对抗性机器学习的研究提供了新的思路和见解，但仍有许多亟待解决的问题，如不完全信息、非理性博弈等。

参考文献

[1] Bountakas P, Zarras A, Lekidis A, et al. Defense strategies for adversarial machine learning: A survey[J]. Computer Science Review, 2023, 49: 100573.

[2] Zhou Y, Kantarcioglu M, Xi B. A survey of game theoretic approach for adversarial machine learning[J]. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2019, 9(3): e1259.

[3] Dalvi N, Domingos P, Mausam, et al. Adversarial classification[C]//Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining. 2004: 99-108.

[4] Brückner M, Scheffer T. Nash equilibria of static prediction games[J]. Advances in neural information processing systems, 2009, 22.

[5] Brückner M, Scheffer T. Stackelberg games for adversarial prediction problems[C]//Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining. 2011: 547-555.

[6] Liu W, Chawla S. Mining adversarial patterns via regularized loss minimization[J]. Machine learning, 2010, 81: 69-83.

[7] Zhou Y, Kantarcioglu M. Modeling adversarial learning as nested Stackelberg games[C]//Pacific-Asia Conference on Knowledge Discovery and Data Mining. Cham: Springer International Publishing, 2016: 350-362.

写在最后

我们的文章可以转载了呢~欢迎转载与转发呦

想了解更多前沿科技与资讯？

点击上方入口关注我们！

欢迎点击右上方分享到朋友圈

香港中文大学（深圳）

网络通信与经济实验室

微信号 : ncel_cuhk

http://mp.weixin.qq.com/s?__biz=MzU5NDIyODY4Ng==&mid=2247489107&idx=1&sn=cc6edd43ad75e00656b2ea64b711014c

网络通信与经济

介绍网络、通信和经济交叉领域的最新科研成果和活动 —香港中文大学（深圳）网络通信与经济学实验室

最新文章

基于年龄奖励机制: 提升信息的新鲜度

利用大语言模型进行差分隐私数据生成

以隐贝叶斯推理解释上下文学习

基于多主体动态博弈视角的深度神经网络训练优化

2024年夏季网络通信与经济学实验室（NCEL）研讨会

解耦知识蒸馏

如何激励去中心化系统的资源池化？

通过数据交易提升在线算法决策的公平性

模型间博弈提升大语言模型输出易读性

借助大语言模型评估文本信息

大语言模型挑战众包工人

基于联合选址和可修复库存模型的城市电车换电服务的规模化布局与运营研究

面向生产环境的大语言模型联邦学习

Galaxy：面向边缘大模型协同推理的分布式边缘智能系统

能量感知年龄优化：基于能量采集的多源更新网络系统中的AoI分析

差分隐私联邦学习中用户选择和隐私补偿机制设计

活动回顾｜李葆春教授：实证联邦学习的数据隐私保护

活动回顾｜文勇刚教授：GPU数据中心大规模深度学习负载调度

差分隐私在机器学习中的实施

联邦遗忘学习概述

神经网络中的特征学习

基于大语言模型的电力系统通用人工智能展望：理论与应用

离线强化学习概述

竞合：数据共享在电子商务中的新策略

众筹中的策略性定价与信息披露

联邦学习在无线网络中的异构用户自适应采样优化算法

对抗性机器学习中的博弈论

大语言模型的机制设计

如何让同行评审更加科学

联邦学习与模型服务提供共存：一种模型训练和模型推理联合优化方法

网络通信与经济实验室（NCEL）2023研讨会暨成立十五周年团建活动回顾

活动回顾 | 牛志升教授：突发流量下节能服务的最佳休眠策略

车对车通信下的信息机制设计

活动回顾 | 香港中文大学（深圳）深圳市群体智能驱动的低碳能源网络重点实验室揭牌仪式暨启动会成功举办

考虑数据新鲜度的移动群智感知激励机制

预测策略性储能行为

边缘内容缓存与分享的经济分析

隐私资源：如何在差分隐私联邦学习中合理分配

2023年夏季网络通信与经济学实验室（NCEL）研讨会

香港中文大学（深圳）黄建伟教授招聘博士生、博士后！

8月18日9:00，Junshan Zhang教授介绍热启动强化学习相关研究

喜讯 | IEEE TNSE 2022年度影响因子攀升至6.6！

喜讯 | 理工学院12位教授获Research.com评为其学术领域内2023顶尖科学家

当数据源耦合时，我们如何优化信息新鲜度？

高精度地图众包中高效车辆选择的轨迹穿透表征

基于模型分解训练的异构多模态联邦学习

基于排序特征学习的多智能体少样本感知

能源区块链系统中提升交易吞吐量的机制设计

基于众包数据标注的联邦学习激励机制设计

【讲座通知】Insights from the Editor-in-Chief: My Recent Experiences

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉