【他山之石】NeurIPS'24｜新型成员推理方法CLiD：一举破解文生图模型隐私难题

科技 2025-01-13 18:05 北京

“他山之石，可以攻玉”，站在巨人的肩膀才能看得更高，走得更远。在科研的道路上，更需借助东风才能更快前行。为此，我们特别搜集整理了一些实用的代码链接，数据集，软件，编程技巧等，开辟“他山之石”专栏，助你乘风破浪，一路奋勇向前，敬请关注！

本文探讨了文本生成图像（文生图）扩散模型的隐私风险，提出了一种基于条件似然差异（CLiD）的新型成员推理方法，以更有效地检测数据是否被用于模型训练。通过实验验证，该方法在真实场景中表现优于现有方法，并为AI模型的隐私保护和数据授权检测提供了新的技术手段。

题目：Membership Inference on Text-to-Image Diffusion Models via Conditional Likelihood Discrepancy

发表会议：NeurIPS 2024

本文是NeurIPS 2024入选论文《Membership Inference on Text-to-Image Diffusion Models via Conditional Likelihood Discrepancy》的中文解读。本文的第一作者翟胜方为北京大学博士生，研究方向为Generative Model Security & Privacy。本文的其他合作者分别来自北京大学、清华大学、西澳大学与南洋理工大学等。

1. Introduction (为什么研究文生图模型的成员推理?)

文生图扩散模型（Text-to-image Diffusion Models）在海量图文数据（Image-text Data）中进行训练，在可控图像生成领域取得巨大成功，而与之伴随的则是更加严重的隐私泄露与数据版权问题 [1,2,3,4]。成员推理（Membership Inference）定义为判断一个给定数据点是否已用于训练该目标模型。成员推理被广泛用于评估模型的隐私泄露，并可以用于检测未经授权数据使用。基于这一背景，本文针对文生图扩散模型上的成员推理任务，并重点考虑以下两个问题：（1）现有的成员推理方法是否在文生图扩散模型真实有效？（2）能否针对文生图扩散模型的训练/微调特性，设计针对性的高效成员推理方法？

主要贡献

① 本文考虑了全面且现实的文生图模型成员推理实验设定，通过参考官方代码的训练步数防止过度训练并严格消除分布偏移，评估了当前面向文生图模型的成员推理在真实场景下的效果，揭示了现有工作的成功幻觉（Hallucination Success）。

② 本文首次发现并广泛验证了文生图扩散模型训练的条件过拟合（Conditional Overfitting）现象，有助于进一步理解条件扩散模型的训练过程。

③ 基于上述现象，本文解析地推导出用于评估模型对图文样本记忆的指示器CLiD（Conditional Likelihood Discrepancy），并基于此设计两种具体的成员推理方法。实验评估显示，本文方法在成员推理的效果和面对数据增强等的鲁棒性方面均优于现有工作。

2. Background

2.1 成员推理任务的形式化

对于传统机器学习任务，给定数据\mathcal{M}$表示为:

其中表示指示器（Indicator）函数（例如最常见的：损失函数）；表示阈值参数阈值参数，用于决定成员推理的判别边界。

对于文生图模型，给定图文数据对，其成员推理任务则表示为：

注：本文也考虑了只有图像数据的情况下，针对文生图模型进行成员推理的设定（参见下文/原文4.6节）。

2.2 扩散模型 (Diffusion Models)

扩散模型的主要思想是在前向过程添加高斯噪音，使得图片逐步逼近标准正态分布，然后训练模型学习逆过程来逐步去噪。对于无条件生成的扩散模型，如DDPM[9]，其损失函数通过优化对数似然的证据下界（Evidence Lower Bound，ELBO）来得到：

而对于条件生成的扩散模型，如Stable Diffusion[10]，其损失函数通过优化相应的条件对数似然的ELBO来得到：

除了训练过程，在后文中，本文也通过ELBO来近似估计扩散模型的似然（Likelihood）

3. Related Works

扩散模型作为研究热点，现阶段已有部分工作探索在其上的成员推理，然而并不能良好适配文生图扩散模型：[5]提出了基于似然比（Likelihood Ratio Attack）的成员推理方法，然而该方法由于需要训练大量阴影模型（Shadow Model）导致存在高计算开销，无法扩展（Scale-up）到文生图扩散模型上；[6,7,8]提出了基于查询的成员推理，计算开销更小，可以扩展到文生图扩散模型。但是由于评估设定不合理而导致的成功幻觉，使其在更真实的文生图任务场景下达不到相对满意的效果。

4. 本文方法

针对现有挑战，本文提出了一种基于条件似然差异（Conditional Likelihood Discrepancy, CLiD）的成员推理方法。在后文中，本文首先引入文生图模型训练过程中观察到的关键现象——条件过拟合（Conditional Overfitting），这一现象为理解模型的训练行为提供了新的视角。然后在此基础上，本文推导出一种适用于文生图扩散模型的成员推理指示器。最后，基于该指示器，本文设计了两类具体的成员推理方法，有效提升了真实场景下的成员推理性能。

4.1 关键直觉—条件过拟合现象

回想无条件生成模型（例如DDPM、GAN）的训练过程，在训练过程中的过拟合现象是指：模型输出分布相比于测试集（又名保留集：hold-out set）会更加偏向训练集（member set）：

在上式中，和分别代表成员集和保留集的分布，代表模型输出分布，该过拟合现象本质上即为现有成员推理任务的直觉基础。

而对于文生图扩散模型（条件扩散模型）的训练过程，本文强调了条件过拟合现象的存在：文生图扩散模型在条件分布上的过拟合要更显著于在边缘分布上的过拟合。其形式化如下：

通过使用不同的分布度量指标（FID等），本文广泛验证了该现象的普适性（见原文图1、图A.1）。

4.2 条件似然差异 CLiD

使用KL散度代入上式，本文可以得到等价形式（证明见附录B）：

其中：

在上式中，忽略，根据不等式两边，便得到一个新的能够揭示成员资格的指示器：

由于该指示器实质上是在计算给定数据点在不同条件下的似然差值，所以称其为条件似然差异（Conditional Likelihood Discrepancy，CLiD）。

接下来，本文使用ELBO来估计相关似然值：

其中代表使用空文本作为条件以近似估计边缘分布。由于该等式右边需要对两个ELBO进行单独蒙特卡洛采样，会导致较高开销。故进一步对该式进行修改，直接对ELBO的差值进行蒙特卡洛采样以减少计算量[11]:

4.3 基于CLiD的成员推理

在实际计算中，本文额外进行如下处理：

① 对文本进行不同程度的裁剪（使用代表），以进一步减小误差：

② 引入对似然的单独估计来增强效果：

注：由于对于似然的估计在前面已经计算过，所以步骤②不会增加任何计算开销。

接下来，本文提出两种成员推理方法，将①和②中得到的不同结果进行合并，分别得到一个标量值或者一个向量值，并据此来区分成员信息（具体计算细节请参考原文）：

一、基于阈值的成员推理方法：

二、基于特征向量的成员推理方法：

其中表示分类器的置信度（本文实验中使用XGBoost实现）。

5. 实验设置

合理的实验设置对于评估成员推理方法至关重要。相关工作[12,13]指出：不合理的评估设定可能带来成员推理的成功幻觉。基于此，本文综合考虑先前工作的实验设定和现实角度的实验设定，并考虑微调和预训练两种训练任务，以从多种角度证明本方法的有效性。

5.1 针对微调的成员推理

5.1.1 Over-training setting

本设定完全按照现有工作[6, 8]的实验设置，即使用Stable Diffusion v1-4模型在Pokemon（训练集/保留集：416/417）、MS-COCO（2500/2500）、Flickr（2500/2500）分别微调15,000步、150,000步、150,000步。

5.1.2 Real-world training setting

由于“Over-training”设置中的微调步数高于实际用户通常的微调步数。所以本文参考HuggingFace上的微调代码示例，以20的Steps/image 的比例对微调步数做了修正：即在Pokemon（训练集/保留集：416/417）、MS-COCO（2500/2500）、Flickr（10000/10000）分别微调7500步、50,000步、200,000步；此外本文引入了微调时常用的数据增强方法（Random-Crop和Random-Flip）以进一步模拟真实情况。

5.2 针对预训练的成员推理

针对预训练的成员推理直接检测数据是否被用于Stable Diffusion v1-5模型的预训练。需要注意的是，先前工作[6, 7, 8]通常使用LAION-Aesthetics v2 5+和MS-COCO分别作为训练集与保留集，这会引入分布偏移（Distribution Shift）[13]，而带来成功幻觉。故本文分别使用LAION-Aesthetics v2 5+ 和 LAION-2B MultiTranslated作为训练集与保留集[13]，并对数据集中的文本进一步处理以消除分布偏移（细节参见原文）。

6 实验与分析（完整实验分析见原文）

6.1 主要结果

上表为Over-training设置下的评估效果。从表中可以看到，由于过高的训练步数带来的过高过拟合，所有基线均取得较好效果，本文的方法甚至达到99%的ASR和AUC值。此外，不同Query（不同计算复杂度）的方法体现不出明显的效果差别，所以本文强调：该实验设定与真实训练（微调）场景不符，不能真实地反映各方法的效果差距。

上表为Real-world training设置下的评估效果。从表中可以看到，根据官方微调示例缩小了训练步数，并添加数据增强方法之后，本文方法相比基线的效果提升显著。

上表为预训练设置下的评估效果。

6.2 有效性轨迹（Effectiveness Trajectory）

在主实验中，可以发现，训练步数对成员推理的指标影响较大。所以本文额外观察在不同微调步数下，成员推理方法的指标变化，如下图所示：

从上图可以观察到，随着训练的进行，的有效性轨迹显著更快上升。在 25,000 步时，有效暴露了成员信息，而其他基线方法大约在 150,000 步时才能达到类似效果。这表明本文方法能够在文生图扩散模型的过拟合程度尚较弱时，更有效地揭示成员信息。

6.3 更弱的假设

上述实验中，本文假设成员推理的实施者可以访问完整的图文对数据点；此外，本文额外考虑一种更弱的假设：实施者只能访问图像，无法获取对应的文本:

在这种假设下，本文首先使用Image-caption模型（在实验中使用 BLIP ）为图像生成对应的伪文本（Pseudo-Text），然后基于图像-伪文本对实施本文方法。在下表中，可以观察到本文的方法依然普遍优于基线方法。可能原因在于伪文本仍会保留图像的关键信息语义，从而使本文方法依然有效。

7 讨论与总结

7.1 现实意义

成员推理传统上被认为是一种潜在的隐私威胁攻击方法[14,15]。然而，在文本生成图像任务中，大部分训练数据来自对网络公开图文对的抓取。这些数据在使用过程中，相较于隐私侵犯，更可能引发版权争端。在此背景下，成员推理可用于评估数据是否存在未经授权使用的可能性。因此，本文旨在设计更高效的成员推理方法，以推动社区在文图数据未授权使用检测方面的研究与实践，产生更积极的影响。

7.2 局限性

由于开源文生图模型的有限性，本文中在预训练的设置下的评估尚不充分。微调设定相比于预训练设定，具有更高的训练步数/图像比，所以本文承认 CLiD-MI 在预训练设置下相较于基线方法的优势不如在微调设置中显著。本文强调，预训练设置下的实验（原文表 3）揭示了现有方法的成功幻觉，并鼓励未来研究关注这一更具挑战性和实际意义的场景。

7.3 总结

本文首次指出了文生图扩散模型中的条件过拟合现象、并提出了 CLiD-MI，一种基于条件似然差异的文生图扩散模型成员推理框架。实验表明，该方法在效果上相比基线具有显著优势，并对提前停止和数据增强具有鲁棒性。本文的方法旨在为社区在图文数据的未授权使用审计方面产生更积极影响。

本文目的在于学术交流，并不代表本公众号赞同其观点或对其内容真实性负责，版权归原作者所有，如有侵权请告知删除。

收藏，分享、在看，给个三连击呗！

人工智能前沿讲习

领先的人工智能知识平台

【源头活水】NeurIPS 2024 | 超越KL！大连理工提出WKD：基于WD距离的知识蒸馏新方法

【他山之石】ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

【源头活水】DEIM: 在DETR中使用多对一匹配的策略加快收敛

【源头活水】GAN归来：模型大幅简化，训练更稳定，逆袭扩散模型，AI社区疯传

【他山之石】DeepSeek V3论文细节：如何绕开CUDA的垄断！

【他山之石】原来，这些顶级大模型都是蒸馏的

【他山之石】创造历史！DeepSeek超越ChatGPT登顶中美AppStore

【他山之石】全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

【源头活水】2025年Next Token Prediction范式会统一多模态吗？

【他山之石】DeepSeek-R1持续刷屏，连Open R1都来了！抱抱脸发起，1天狂揽1.9k星

【源头活水】中国AI太强，Meta工程师吓疯？自曝疯狂熬夜复制DeepSeek，天价高管心虚了

【他山之石】Transformer作者初创重磅发布Transformer²！AI模型活了，动态调整自己权重

【他山之石】扩散模型也能推理时Scaling，谢赛宁团队重磅研究可能带来文生图新范式

【他山之石】顶刊TPAMI 2024！北大提出实用、紧致的图像压缩感知网络PCNet，代码已开源

几秒生成逼真3D场景，泛化媲美Stable Diffusion | 浙大&蚂蚁等提出Prometheus

【源头活水】近8年后，谷歌Transformer继任者「Titans」来了，上下文记忆瓶颈被打破

【他山之石】重新思考图像超分辨率中的不平衡问题以实现高效推理(nips2024)

【源头活水】一个关于MoE的猜想

【他山之石】TPAMI-2024 | Uni-AdaFocus视频理解框架，让AI学会「划重点」，计算效率提升4-23倍！

几秒生成逼真3D场景，泛化媲美Stable Diffusion | 浙大&蚂蚁等提出Prometheus

即插即用，无缝集成各种模型，港科大&蚂蚁等发布Edicho：图像编辑一致性最新成果！

纯卷积实现用于图像生成扩散模型？DiC：重新思考扩散模型中的 3×3 卷积

【他山之石】TPAMI 2024 | 倒置金字塔多任务Transformer用于视觉场景理解

【源头活水】NeurIPS 2024 Spotlight | 轻微的预训练数据扰动如何造就更优秀的扩散模型

【他山之石】NIPS 2024 | 注意力掩码和LayerNorm在Transformer中的作用

【他山之石】NeurIPS'24｜新型成员推理方法CLiD：一举破解文生图模型隐私难题

【源头活水】视频任意门来了！港大&达摩院新作VideoAnydoor：向视频无缝传送物体，同时支持准确动作控制

【他山之石】AAAI 2025 | 基于真实世界雾霾驾驶视频的视频去雾和深度估计

【源头活水】英伟达「世界基础模型」诞生，引爆物理AI革命！75页报告出炉，GitHub狂飙2k星

AAAI 2025 | SparseViT：以非语义为中心、参数高效的稀疏化视觉Transformer

注意力计算减少99.5%，端侧文生图扩散模型成功范式！CLEAR：类卷积线性扩散Transformer

【源头活水】英伟达「世界基础模型」诞生，引爆物理AI革命！75页报告出炉，GitHub狂飙2k星

中科院/中科大/芝加哥大学创新动态Token合并框架，无需微调，依然强大，零样本视频理解的突破性进展！

【他山之石】AAAI 2025 | IML领域首个稀疏化视觉Transformer，代码已开源

【源头活水】人工智能是不是走错了方向？

【源头活水】OpenAI奥特曼发长文「反思」：十年艰难创业路，如今已掌握AGI秘诀

【他山之石】AAAI 2025 | 基于真实世界雾霾驾驶视频的视频去雾和深度估计

【源头活水】DeepSeek V3获竞技场最强开源认证！与Claude 3.5 Sonnet对比实测来了

1.4s 即可生成1024px图像！SnapGen：轻量化架构和训练策略实现端侧文生图

【他山之石】ACCV 2024 | ViT涨点神器！DeBiFormer：双层路由注意力新框架

【源头活水】数据不够致Scaling Law撞墙？CMU和DeepMind新方法可让VLM自己生成记忆

【他山之石】AAAI 2025｜腾讯优图实验室10篇论文入选，含大型语言模型、深度伪造检测等研究方向

【源头活水】聊一聊大模型六小虎和四大厂的2024！

【源头活水】NeurIPS 2024｜让模型预见分布漂移：动态系统颠覆性设计引领时域泛化新革命

【他山之石】AAAI 2025 | 港大提出SparX：强化Vision Mamba和Transformer的稀疏跳跃连接机制

【综述专栏】2024->2025必看的十大「人工智能领域综述」论文

【他山之石】国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10，细节全公开

【源头活水】AAAI 2025 | SparseViT：参数高效的稀疏化视觉Transformer

【源头活水】首次！大模型自动搜索人工生命，做出AI科学家的Sakana AI又放大招

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉