南京航空航天大学|抗合谋攻击的隐私保护数据库指纹机制(IEEE TIFS 2024)

文摘   2024-10-30 08:30   广东  

一、方法简介


大数据环境下海量数据频繁的交互共享, 数据库通常包含私有敏感和专有的信息,随之带来的数据库隐私保护和泄露追踪问题日益严重。现有许多研究工作分别单独解决数据库隐私保护和泄露追踪问题。为了解决数据库隐私保护的挑战,可以采用数据加密、数据匿名和差分隐私等技术. 为了保护数据库版权和非法再发布,研究者提出数据库水印/指纹技术可以实现版权保护、数据追踪,有效避免数据泄露的风险。也有研究工作以两阶段序列方式,组合数据库净化和水印/指纹技术解决上面两个挑战,其结果会大量地改变数据库中的数据项,损失可用性。当数据库所有者(Database Owner)共享数据库给不同的数据分析者(Data Analyzer)或者用户时,通常有三个数据共享目标:(1)数据库隐私保护,例如,抵抗属性推理攻击;(2)阻止数据库非法再分发和追踪恶意用户;(3)维持数据库高可用性,支持高精度SQL查询、数据挖掘和统计分析。为了确保数据库所有者的数据共享目标,研究者提出数据项级差分隐私指纹(Differential Privacy FingerPrinting,DPFP)机制,同时实现隐私保护和盗版追溯功能。然而,DPFP的鲁棒性仅针对单个恶意用户,针对逻辑与和逻辑或合谋攻击,其无法采用ACC (Anti-Collusion Code,ACC)唯一识别全部合谋者。

进一步,在本文研究中,我们提出抗合谋差分隐私指纹(Collusion-Resilient Differential Privacy FingerPrinting,CRDPFP)机制,该机制可直接采用ACC唯一识别全部合谋者。具体地,针对逻辑与和逻辑或合谋攻击,我们首先从理论和实验层面证明现有数据库指纹方案无法直接采用AND-ACC和OR-ACC唯一识别全部合谋者。其次,针对5种合谋攻击方式(逻辑与、逻辑或、随机、平均,最大),我们设计一种基于CFF码和I码的分组级联抗合谋指纹编码(Group-oriented Concatenated, GC)和追踪算法,可在数字指纹编码层面上追踪使用逻辑与和逻辑或的全部合谋者。我们利用GC指纹编码的随机特性,设计比特级随机响应并且在整个数据库上实现数据项级差分隐私保证。CRDPFP机制的指纹嵌入和提取算法具体如图1所示。   


图1 CRDPFP指纹嵌入与提取算法


二、实验评估


我们使用了两个UCI经典数据集评估CRDPFP,其中包括Census和Nursery。根据不同的GC编码分布,CRDPFP有4种场景,我们将其与现有2种经典数据库指纹方案进行对比。实验结果表明:CRDPFP在50%随机翻转攻击方面有更强的鲁棒性;在追踪至少一个合谋者方面有更高的检测率、在追踪至少一个无辜用户方面有更低的检测率;针对逻辑与和逻辑或攻击可以唯一识别全部合谋者;当使用抗合谋指纹编码是均匀分布时(指纹参数趋近于2),可以实现接近DPFP一样的可用性,如图2所示。

图2 对比嵌入指纹后的数据库准确性


论文信息


该研究已被IEEE TIFS 2024录用,作者是南京航空航天大学计算机科学与技术学院的张顺生、朱友文(通信作者)和曾骜。

Shunsheng Zhang, Youwen Zhu* and Ao Zeng, "Collusion-Resilient Privacy-Preserving Database Fingerprinting," in IEEE Transactions on Information Forensics and Security, doi: 10.1109/TIFS.2024.3455748.



供稿:张顺生、朱友文

隐者联盟
本公众号主要推介多媒体、人工智能、信息安全等方面的最新研究进展,愿与同行携手,共同推动科学研究向前发展。
 最新文章