随着深度神经网络(DNN)的卓越表现,人工智能行业正在迅猛发展,尤其是在图像分类、自动驾驶、医学诊断等领域取得了显著进展。然而,这也带来了新的挑战:图像数据集作为知识产权的重要组成部分,容易受到篡改和滥用,可能导致严重的经济损失和知识产权安全风险。因此,评估图像数据集在保护知识产权方面的安全性至关重要。可逆对抗样本(RAE)应运而生,旨在通过消除对抗扰动,阻止未授权用户使用受保护图像,同时允许授权用户恢复图像的原始可用性。但现有RAE方法未考虑数字水印的追溯性问题,缺乏对数据集重新分发后的安全保障。因此,迫切需要一种新的解决方案,既能利用RAE的图像恢复能力,又能确保图像的追溯性和安全性。本文提出的TAE-RWP方法,结合了对抗扰动与图像恢复技术,通过签名参数实现扰动的形变控制,不仅能够防止未经授权的使用,还能保证合法用户恢复图像的可用性,同时具备追溯性,确保在实际应用中的知识产权安全。如图1所示,在TAE-RWP中,受保护的数据集和恢复数据集中的对抗扰动和恢复扰动分别由生成器和恢复模型生成。具体来说,生成器生成的对抗扰动将在由特定签名参数控制的区域内进行图像翘曲,恢复模型则学习如何生成具有特定翘曲的对抗扰动。这些签名参数作为认证证据,且对每个授权用户都是唯一的。在版权验证阶段,TAE-RWP采用“噪声模式”训练方法训练验证模型,以区分由签名参数生成的翘曲对抗扰动和随机噪声。当发现可疑数据集时,通过将可疑数据集的数据与受保护数据集像素之差输入验证模型进行相似度的评估,若该差值与训练阶段由签名参数生成的翘曲对抗扰动相似度超过一定阈值,则可判断可疑数据集可能来自于恢复数据集。实验结果证实了方案的可行性和先进性。图1 TAE-RWP生成,恢复与版权验证的总流程
论文信息
本篇论文作者为海南大学的邢帆、周晓谊(通讯作者)、彭红利、樊雪峰、韩文报、中国科学院大学的张玉清。Fan Xing, Xiaoyi Zhou*, Hongli Peng, Xuefeng Fan, Wenbao Han, Yuqing Zhang. TAE‐RWP: Traceable Adversarial Examples With Recoverable Warping Perturbation. International Journal of Intelligent Systems, 2024(1), 6054172.[DOI: 10.1155/2024/6054172] 个人主页:https://scs.hainanu.edu.cn/info/1051/1878.htm
供稿:周晓谊、邢帆