NO.1 论文简介
大数据时代下,随着媒体种类的繁多和形式的丰富,单一模态的隐写技术,例如在图像中隐藏图像或者在音频中隐藏音频,已经不足以满足人们对于信息传输和隐私保护的复杂需求。因此,探索多模态的隐写技术已经成为一个新的趋势。可逆网络因其具有天然可逆的结构,非常适用于信息隐藏领域。图像能以生动直观、有层次的方式传递信息,而音频是一种广泛传播和使用的媒体文件,具有较大的嵌入容量,因此在音频中隐藏图像具有较高的研究和应用价值。
NO.2 主要贡献
(1)提出了一种基于可逆网络的音频藏图算法,通过可逆网络中共享参数的正向和逆向过程分别实现信息的隐藏和恢复,对应的网络结构如图1所示。这种方法能有效解决现有音频藏图方法中编码特征与解码所需特征不一致的问题,提升了隐写音频和重建图像的质量,且具有较高的安全性。
图1 基于可逆网络的音频藏图网络结构图
NO.3 研究结论
本文提出了一种利用可逆网络的音频藏图方法。为了进行多模态数据的统一和融合,本文利用图像特征提取与表示模块获得图像的一维特征表示。为了提升隐写音频的质量,本文采用小波变换对音频的高低频进行分离,并且通过损失函数约束图像嵌入到人耳感知不敏感的高频区域。同时,本文采用了可逆网络中参数共享的正向和逆向过程分别对隐藏和恢复过程进行建模,能有效减少载体音频的失真并提升重建图像的质量。实验结果表明,所提出的算法在实现高嵌入率的同时,能生成质量更高的隐写音频以及重建出与秘密图像更为相似的彩色图像,与现有深度学习方法相比,隐写音频的SNR提升了2.98 dB,重构图像的PSNR提升了3.26 dB,同时有较好的抗隐写分析能力。
NO.4 论文资助
国家自然科学基金(62272197)
广东省基础与应用基础研究基金(2023A1515011928)
NO.5 作者介绍
张晓虹(1998—),女,暨南大学硕士研究生,
E-mail:2551748721@qq.com。
E-mail:shijun_xiang@qq.com。
E-mail:thhb@jnu.edu.cn。
·引用格式·
张晓虹, 项世军, 黄红斌. 利用可逆网络的音频藏图算法(2023) [J/OL]. 西安电子科技大学学报, [2024-03-21]. https://doi.org/10.19665/j.issn1001-2400.20240303
· 原文链接 ·
“扫描二维码查看原文”
https://link.cnki.net/doi/10.19665/j.issn1001-2400.20240303
编辑:许瀚樱
校对:杨 薇
审核:牛姗姗
· 推荐阅读 ·
- 联系我们 -
xuebao@mail.xidian.edu.cn