HCGAN:一种基于GAN 的高容量信息隐藏算法

2022-05-06 06:06张克君李旭于新颖冯丽雯秦昊聪张健毅
关键词:解码器编码器载体

张克君,李旭,于新颖,冯丽雯,秦昊聪,张健毅

(1.北京电子科技学院网络空间安全系,北京市 100071;2.北京邮电大学网络空间安全学院,北京市 100876)

随着网络信息技术的快速发展和移动终端设备的不断普及,数字多媒体成为互联网通信的主要载体.数字多媒体的广泛应用使得网络中充斥着大量对国家、企业或个人而言十分敏感的信息.为保证这些信息能被安全地传递,发送方通常需要对信息进行加密,同时加密后的密文只能被持有特定密钥的接收者解密,但密文的伪随机性会暴露秘密信息的存在,从而引来攻击者的怀疑和攻击.信息隐藏技术通过将敏感的秘密信息伪装成普通信息来隐藏秘密信息,为上述问题提供了解决方案,对信息安全有着重要意义[1].

在信息隐藏过程中,发送方首先将秘密信息嵌入载体中形成含秘载体,随后把含秘载体上传到公共信道[2].特定的接收方从公共信道中下载含秘载体,使用密钥或提取算法从中提取出秘密信息.在秘密信息的传递过程中,除了通信双方之外,其他人虽然可以下载含秘载体但无法获取其中的秘密信息.信息隐藏技术的这种隐蔽性能够有效阻止攻击者对秘密信息的感知和破坏,进而保证了秘密信息在传递过程中的安全[3].

信息隐藏技术和加密技术的结合既防止了秘密信息的存在被知晓,又保护了秘密信息的内容,但仍不能保证秘密信息的绝对安全.发送方在嵌入秘密信息时会不可避免地对载体造成干扰,隐写分析就可以对这些干扰进行分析并判断出载体是否含有秘密信息.信息隐藏和隐写分析互为对手,在相互对抗中不断发展进步.为了对抗隐写分析,信息隐藏已经从早期的最低有效位(Least Significant Bit,LSB)替换算法[4]发展到现在根据载体内容来嵌入秘密信息的自适应信息隐藏算法.在不断进步的信息隐藏技术的推动下,隐写分析也很快实现了从专用到通用,从低维特征到高维特征的跨越.

不断进步的隐写分析算法虽然促进了信息隐藏算法的发展,却对信息隐藏技术的安全性提出了挑战.近年来,深度学习技术在运算速度更快的硬件支持下迅速发展,不断涌现出各种网络模型.深度置信网络[5]及反向传播算法的提出更是推动了深度学习技术在计算机视觉、自然语言处理和自动驾驶等领域的发展.深度学习强大的学习能力和特征表达能力,使得隐写分析算法的设计不再需要丰富的专业知识.在基于深度学习的隐写分析算法被提出之后,隐写分析对含秘载体的检测能力越来越强,这迫使信息隐藏领域的研究者开始研究更加安全的信息隐藏算法.

在对信息隐藏技术的探索中,Goodfellow 等人于2014 年提出的生成对抗网络[6](Generative Adver⁃sarial Networks,GAN)受到了信息隐藏技术研究者的关注.GAN 包含两个神经网络,其中一个网络能够生成符合真实样本分布的生成样本,另一个网络用来区分真实样本和生成样本,这两个网络互相对抗并交替训练.GAN 这种对抗博弈的方法和信息隐藏技术与隐写分析算法互相对抗并不断发展的情况十分相似,因此信息隐藏技术的研究者期望将GAN 用于信息隐藏中以得到更强的安全性和更高的隐写容量.迄今为止,基于GAN 网络的信息隐藏算法并没有完全实现上述目标,它们在隐写容量、安全性和秘密信息提取准确率等方面还存在不足.因此,研究基于GAN 的信息隐藏技术并使其在隐写容量和安全性等方面获得提升有着重要的实际意义.

本文提出了一种新的基于GAN 的高容量信息隐藏算法(HCGAN).该算法能够在高容量的情况下保持较高的秘密信息提取率,并且有较强的抗隐写分析能力.HCGAN 算法由三部分组成:①基于Im-Residual结构的编码器,发送方能够通过编码器将秘密信息嵌入载体图像中形成隐秘图像;②基于稠密结构的解码器,接收方可以通过解码器将秘密从隐秘图像中提取出来;③基于隐写分析的鉴别器,用来进行对抗性训练以提高隐秘图像的抗隐写分析能力.本文的主要贡献如下:

1)提出了基于Im-Redisual 结构的编码器,其中Im-Residual 结构是基于Residual 结构进行优化所形成的,Im-Residual 结构的编码器采用多次嵌入的思想能够降低秘密信息因特征提取而产生的信息损失,从而提高秘密信息提取率.

2)设计了基于稠密结构的解码器,利用Dense结构特征复用的能力提取出更多有用特征,以进一步提高解码器的秘密信息提取率.

3)提出了一种基于隐写分析的鉴别器,通过GAN 的对抗训练思想进一步提升HCGAN 信息隐藏算法的抗隐写分析能力.

1 相关工作

1.1 经典的信息隐藏算法

根据所使用的方法不同,信息隐藏技术可以分为经典的信息隐藏算法和基于深度学习的信息隐藏算法.

最低有效位替换算法作为早期的信息隐藏算法,只对像素中最不影响图像视觉效果的最低有效位进行修改[4].LSB 替换算法能保证载体的视觉质量,但在嵌入过程中没有考虑载体的统计特征.因此,隐写分析算法可以轻易地根据直方图异常等特征识别出通过LSB 替换算法获得的含秘载体.像素值差分[7](Pixel Value Differencing,PVD)使用两个连续像素之间的差来表示秘密信息,比LSB 替换算法更安全,但是也存在统计特征的异常.此后,研究者们设计信息隐藏算法时就注意保持某些统计特征不变.LSB 匹配算法对LSB 替换技术进行改进,如果秘密比特和载体图像的LSB 不匹配,则在相应的像素值上随机加减1[8].随机加减1 的方法可以保持载体图像的统计直方图不变,但最低位和次低位的统计特征异常仍会使LSB匹配算法不够安全[8].除了可以在空间域嵌入秘密信息以外,也可以在各种变换域嵌入秘密信息.离散余弦变化(Discrete Cosine Trans⁃form,DCT)就是一种变换域.与傅立叶变换类似,DCT 可以将图像从空间域转换到频率域.JPEG 格式的图像就使用了DCT,其对每个颜色成分使用余弦变换来将大小为8×8的连续像素块转换为64个余弦系数.JSteg[9]、OutGuess[10]等方法都是在DCT 的基础上嵌入秘密信息的信息隐藏算法.

信息隐藏算法能够根据载体内容自适应地嵌入秘密信息来提高算法的安全性.2010 年,Pevný 等人[11]提出的HUGO 就是一种自适应的信息隐藏算法.HUGO 首先通过嵌入信息对载体图像的影响来定义失真函数,随后使用加权范数函数将像素空间压缩为特征空间,并在失真函数最小的位置嵌入秘密信息[11].2012年,Holub等人[12]提出的WOW(Wavelet Obtained Weights)算法可以根据图像内容在纹理复杂的区域嵌入更多的信息.2014 年Holub等人[13]提出的S-UNIWARD 算法是一种与嵌入域无关的通用失真函数.虽然HUGO、WOW 和SUNIWARD的失真函数各不相同,但三个算法的最终目的都是通过最小化失真函数来自适应地嵌入秘密信息.此后提出的经典的信息隐藏算法或是改进失真函数[14],或是改进隐写编码[15].这些改进虽然提高了信息隐藏的安全性,但对信息隐藏算法的隐写容量提高非常有限.

1.2 基于深度学习的信息隐藏算法

基于深度学习的信息隐藏算法被提出后,经典信息隐藏算法的安全就面临着严重的威胁.将深度学习应用于信息隐藏领域以对抗基于深度学习的隐写分析算法成为信息隐藏领域中新的研究方向.特别是生成对抗网络,其优秀的图像生成能力和博弈对抗的思想引起了信息隐藏领域研究者们的关注.

2017 年,Hayes 等人[16]提出将GAN 与信息隐藏相结合的Ste-GAN-ography算法.该算法使用三个普通的神经网络分别作为嵌入秘密信息的生成器、提取秘密信息的提取器和进行隐写分析的鉴别器,训练过程和一般的生成对抗网络相同.2017 年,Tang等人[17]提出了ASDL-GAN 算法.该算法首先学习一个概率映射矩阵来为秘密信息寻找合适的嵌入位置,然后使用传统的STC方法嵌入秘密信息.Yang 等人[18]在ASDL-GAN 的基础上进行改进,使用Tanhsimulator激活函数、基于U-NET[19]的生成器和SCA[20]判别器来减少训练时间并增强抗隐写分析能力.Liu等人[21]于2018年提出了一种直接使用ACGAN生成器进行无载体信息隐藏的Stego-ACGAN 算法.该算法通过建立图像类别与文本之间的映射字典,将秘密信息表示为图像类别信息,然后将图像类别信息输入生成器生成含秘图像,从而实现无载体的信息隐藏[21-22].2019 年,Zhang 等人[23]提出一种基于约束采样的含密载体生成方法.该方法首先训练一个生成器,然后通过数字化卡登格子对生成器进行约束采样,以获得满足条件的含密图像.

自2017 年提出在载体图像中隐藏秘密图像的应用场景后,图像信息隐藏这一方向迅速成为信息隐藏领域的研究热点[24].2017 年,Baluja 等人[24]提出使用神经网络在图像中寻找合适的位置并嵌入秘密图像信息.该方法对编码过程进行训练,将整个秘密图像嵌入载体图像中并使秘密图像信息分散到图像的每个比特中.2018 年,Zhang 等人[25]提出将封面图像分为Y、U、V 三个通道,并通过编码器将灰度化的秘密图像隐藏到封面图像的Y 通道中.2020年,Duan等人[26]提出了一种结合图像椭圆曲线密码学和深度学习的大容量信息隐藏算法.该算法利用离散余弦变换对秘密图像进行变换,再用椭圆曲线密码术对变换后的图像进行加密,最后使用SegNet[27]网络来隐藏和提取秘密信息.

图像信息隐藏算法带来的高隐写容量是在损失部分秘密图像数据的前提下达成的.这些算法之所以能隐藏秘密图像信息,是因为图像能够在损失部分数据后不影响信息的呈现.如果要隐藏较多的文本或其他类型的秘密信息,使用现有的图像信息隐藏算法会导致较低的秘密信息提取准确率和较弱的抗隐写分析能力.

本文对图像信息隐藏算法进行研究后发现引起秘密信息损失的主要原因是卷积层只能提取有限特征.因此,本文设计了基于Im-Redisual 结构的编码器,通过减少编码过程中的信息损失来提高秘密信息提取率.本文利用基于稠密结构的解码器和基于隐写分析的鉴别器分别来提高秘密信息提取率和抗隐写分析能力.

2 基于GAN的高容量信息隐藏算法HCGAN

为解决信息隐藏算法存在的隐写容量低和抗隐写能力弱的问题,本文提出了一种基于GAN 的高容量信息隐藏算法(HCGAN).如图1 所示,HCGAN 算法主要由三部分组成:基于Im-Residual 结构的编码器、基于稠密结构的解码器和基于隐写分析的鉴别器.基于Im-Residual 结构的编码器将输入的秘密信息和载体进行编码以得到含秘载体.发送方得到含秘载体后将其上传到公共信道中.接收方从公共信道中获得含秘载体后,使用基于稠密结构的解码器从含秘载体中解码出秘密信息.基于隐写分析的鉴别器的任务是区分含秘载体和普通载体,并在训练时提供梯度以优化基于Im-Residual 结构的编码器.需要注意的是,基于隐写分析的鉴别器只在模型训练时使用.模型只需使用基于Im-Residual 结构的编码器和基于稠密结构的解码器就可以完成秘密信息的传递.本节将详细介绍HCGAN 模型的三个组成部分及其总体架构,并描述其训练过程.

图1 基于GAN的高容量信息隐藏模型的整体框架Fig.1 Overall framework of high capacity information hiding model based on GAN

2.1 基于Im-Residual结构的编码器

为提高模型的隐写容量,本文在残差网络结构的基础上进行改进,得到了一种被称为Im-Residual的网络基础结构.Im-Residual 结构通过增加秘密信息的直接映射来减少秘密信息在特征提取过程中的损失.基于Im-Residual 结构的编码器更适用于信息隐藏,并且能够增加载体中可以嵌入的秘密信息.

编码器的目标是将秘密信息安全地嵌入载体图像中,从而方便解码器从中提取出秘密信息.如图2(a)所示,基于深度学习的信息隐藏算法的编码器一般使用多个基础卷积层+LeakyReLU 激活函数+BN 层结构作为卷积神经网络.因为卷积神经网络是通过卷积核提取特征,再将提取出来的特征归一化处理后作为下一个卷积核的输入,所以在此过程中不可避免地会因为提取特征而损失信息.对图像类型的秘密信息而言,损失一部分不重要的信息是可以接受的,并且不会影响秘密信息内容的传递.但是对于其他类型如文本类型的秘密信息而言,损失一部分信息是不可接受的.因此,为了使编码器结构能适用于其他类型的秘密信息,Kevin A.Zhang 等提出使用Dense 结构的卷积神经网络来降低编码器对于信息的损失,如图2(b)所示.但Dense 结构也会导致输入增加,进而增加需训练的参数[28].

在研究和分析了Dense结构之后,我们发现其能减少信息损失的核心原因不是Dense 结构带来的特征的多次重复使用,而是对秘密信息的多次嵌入.因此,本文提出了基于Im-Residual 结构的编码器,如图2(c)所示.在残差结构的基础上通过短路多次嵌入秘密信息,优化了编码器模型,减少了约1/3 的训练参数,最终得到了更优的提取率和视觉性能.Dense 结构和Im-Residual 结构的参数对比如表1 所示,表中D为嵌入率.

图2 三种编码器对比图Fig.2 Comparison of three encoders

表1 Dense结构和Im-Residual结构的参数对比Tab.1 Comparison of parameters between Dense structure and Im-Residual structure

在本文中,基于Im-Residual 结构的编码器通过Im-Residual 结构的卷积神经网络将秘密信息嵌入载体图像中以得到含秘图像,如公式(1)所示:

式中:C为W×H×3的彩色载体图像,M∈{0,1}D×w×H为将要嵌入的秘密信息,S为W×H× 3的彩色含秘图像.

2.2 基于稠密结构的解码器

在基于Im-Residual 结构的编码器将更多的秘密信息嵌入载体中之后,如何从含秘载体中更好地提取出秘密信息就成了后续研究的重点.Im-Residual 结构可以使用更少量参数完成将少量信息嵌入图片等含有大量信息的载体中,以减少过拟合风险并完成编码器工作.但在需要从大量信息中提取出少量信息的解码器场景中,Im-Residual 结构就无法提供足够的信息供后续网络层使用.因此为提高解码器的提取能力,本文设计出了一种基于稠密结构的解码器.稠密连接网络中每一个网络层输出的特征映射会直接叠加到后面网络层的输入中,以实现特征的复用.特征的复用保证了后面网络层的信息总是多于前面网络层的信息.基于稠密结构的解码器就是利用稠密结构特征复用的能力对含秘载体的特征进行多次处理以提高秘密信息的提取准确率.

基于深度学习的信息隐藏算法的解码器使用的也是基本的卷积层+LeakyReLu+BN 层结构,如图3(a)所示.然而,网络层数的增加会带来信息损失的问题.稠密结构通过将卷积层提取出的特征叠加在之后所有的卷积层的输入中,来实现各层特征的复用并降低信息的损失.因此,本文设计出基于稠密结构的解码器来对含秘图像中的秘密信息进行提取,如图3(b)所示.实验结果显示基于稠密结构的解码器在高容量的信息隐藏算法中表现出更优的秘密信息提取率,并能指引编码器实现更优的视觉效果.

图3 两种解码器对比图Fig.3 Comparison of two decoders

本文模型将基于Im-Residual 结构的编码器和基于稠密结构的解码器组合起来形成了一种自编码器.这种自编码器能够实现高隐写容量的信息隐藏,其过程如公式(2)所示:

式中:E(C,M)代表W×H×3的彩色含秘图像,是基于稠密结构的解码器从含秘图像中提取出的秘密信息,D为嵌入率,表示我们想要在载体图像的每个像素中嵌入的秘密信息比特数.

2.3 基于隐写分析的鉴别器

基于Im-Residual 结构的编码器和基于稠密结构的解码器所构成的自编码器能够实现高隐写容量的信息隐藏,但是在含秘图像中嵌入大量的秘密信息会导致其抗隐写分析能力降低.因此,为了提高含秘图像的抗隐写分析能力,本文提出了基于隐写分析的鉴别器.该鉴别器利用其鉴别结果和GAN 的对抗性来训练编码器,从而生成更安全的含秘图像.

本文在XuNet 的基础上进行改进,使用全部的SRM滤波核和KV核作为预处理层,并在模型训练时将SRM 滤波核的参数固定.相比于KV 核,使用全部的SRM滤波核能够提供更多的噪声信息以便后面的神经网络进行特征提取和分类.为了适用于彩色含秘图像,本文在对含秘图像进行分析前加入了灰度层来将彩色含秘图像变为灰度含秘图像,以便后续的处理.基础的鉴别器和本文提出的基于隐写分析的鉴别器对比图如图4所示.

图4 两种鉴别器对比图Fig.4 Comparison of two discriminators

利用GAN 的对抗博弈能力,本文提出的基于隐写分析的鉴别器和基于Im-Residual 结构的编码器实现了相互对抗并且相互提供梯度,最终提高了基于Im-Residual 结构的编码器输出含秘图像的抗隐写分析能力.在训练过程中,我们将含秘图像或载体图像输入基于隐写分析的鉴别器得到对应的鉴别结果,如公式(3)所示:

式中:C表示尺寸为3 ×W×H的彩色载体图像,M表示需嵌入的秘密信息,p表示分类结果,一般用输入图像是载体图像的概率来表示.

2.4 HCGAN的整体架构和损失函数设计

将基于Im-Redisual 结构的编码器、基于稠密结构的解码器和基于隐写分析的鉴别器组合起来就是本文提出的HCGAN 算法的整体架构,如图5 所示.其中,⊕代表像素相加.首先,发送者将秘密信息M和彩色载体图像C输入编码器网络来得到隐秘图像S.之后,接收者将隐秘图像S输入解码器网络得到解密后的信息.基于隐写分析的鉴别器仅在训练时使用,用来判断S或C是否为隐秘图像,并通过对抗性训练优化编码器网络以提高隐秘图像S的抗隐写分析能力.

图5 HCGAN信息隐藏算法架构Fig.5 HCGAN information hiding algorithm architecture

本文提出的基于GAN 的高容量信息隐藏模型包含编码器、解码器和鉴别器三个部分,因此需要对这三个部分分别设计损失函数

2.4.1 相似性损失

基于Im-Residual 结构的编码器作为嵌入过程需要将秘密信息嵌入载体图像中形成含秘图像,因此,首先要保证在载体图像和含秘图像之间不存在肉眼可以感知的失真.图像之间的相似性可以使用SSIM 和PSNR 来表述.为了便于计算,本文使用均方误差(也称L2 损失)作为载体图像和含秘图像相似性的评价指标,如公式(4)所示:

式中:C表示载体图像,W和H表示载体图像的宽和高,PC表示载体图像的分布,M表示秘密信息,E(C,M)则表示编码器网络的输出,即含秘图像.

2.4.2 准确率损失

准确率损失指的是基于稠密结构的解码器从含秘图像中提取出的秘密信息和原本的秘密信息之间的差距.交叉熵是一种机器学习的损失函数,可以用来衡量两个随机变量之间的差别,因此本文选择交叉熵函数作为算法的准确率损失,如公式(5)所示:

式中:PC表示载体图像的分布,D(E(C,M))表示解码器提取出来的秘密信息.交叉熵函数在这里用CrossEntropy表示,如公式(6)所示:

式中:y表示真实分类标签,在二分类中y可以为0或表示预测样本标签为1 的概率.因此,交叉熵函数也可以表示为公式(7):

2.4.3 安全性损失

基于隐写分析的鉴别器的目标是区分含秘图像和载体图像,同时具有一定的隐写分析的能力.因此和一般的GAN 一样,本文使用鉴别器的输出作为安全性损失,如公式(8)所示:

式中:S(E(C,M))表示鉴别器的输出.

2.4.4 编码器的损失函数

基于Im-Residual 结构的编码器是模型的核心,其性能的优劣对上述三个损失都有很大的影响,因此本文将基于Im-Residual 结构的编码器的损失函数定义为公式(9):

2.4.5 解码器的损失函数

与基于Im-Residual 结构的编码器相比,基于稠密结构的解码器的损失函数就比较简单,只与准确率损失有关,如公式(10)所示:

2.4.6 鉴别器的损失函数

基于隐写分析的鉴别器被用来区分载体图像和含秘图像,并在训练过程中给基于Im-Residual 结构的编码器提供梯度.因此在训练整个网络时,基于隐写分析的鉴别器训练至关重要,它所提供的梯度直接影响着基于Im-Residual 结构的编码器性能和含秘图像的质量.因此,本文使用Wasserstein 距离作为基于隐写分析的鉴别器的损失函数,如公式(11)所示:

每次迭代使用损失函数来判断神经网络的好坏,并使用梯度下降的方法来更新神经网络的参数.

3 实验分析

信息隐藏算法的性能可以从三个角度进行评估:图像中可以隐藏的数据量,即容量;含秘图像与载体图像之间的相似度,即失真;隐写分析工具避免检测的能力,即安全性.因此,本节分别设计实验验证容量、失真和安全性.若无特殊说明,所有实验均使用Pytorch 框架实现,并在单个NVIDIA GTX1080 Ti GPU 上进行训练.ADAM 优化器用于最小化损失,学习率为0.000 4.

3.1 评价标准

3.1.1 峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)

实验使用PSNR 和SSIM[26]来评价含秘图像和载体图像的相似度.PSNR 代表峰值信噪比,给定载体图像C、含秘图像S和可能的最大像素值MAX1,PSNR的计算方式如公式(13)所示:

3.1.2 结构相似性(Structural SIMilarity,SSIM)

SSIM 代表结构相似性,由载体图像C的采样x和含秘图像S的采样y之间的三个比较衡量——亮度、对比度和结构来计算,如公式(14)所示:

式中:μx和μy分别是x和y的均值,σx和σy分别是x和y的方差,σxy是x和y的协方差.r1=(k1MAX1)2、r12=(k2MAX1)2为两个常数,一般设k1为0.01、k2为0.03.

3.1.3 RS-BPP评价方法

为了测量基于深度学习的信息隐藏算法的有效容量,本文采用Zhang 等人提出的RS-BPP[28]评价方法.该方法表示图像中可以可靠传输的平均比特数除以图像的大小.因此,RS-BPP 可以直接与传统的隐写技术进行比较,其值等于1 -2p,p为提取错误率.

3.2 失真和容量分析

本文在LUSN-bed数据集中对不同编码器-解码器结构在嵌入率D ∈{1,2,…,6}的情况下进行训练,并分别使用PSNR、SSIM 和RS-BPP 对各个算法的失真和容量在测试集中进行测试,结果如图6 和表2所示.

图6 不同编码器-解码器在不同嵌入率下的隐秘图像Fig.6 Secret images of different encoders-decoders at different embedding rates

从图6 中可以看出,就算是在6 bpp 的嵌入率的情况下,隐秘图片也未显示出肉眼可见的失真.通过对比表2 中高嵌入量下的基础提取器和基于Dense结构的提取器的结果可以发现,无论使用哪种编码器,基于Dense 结构的解码器总是有更高的容量,可证明使用Dense 结构确实可以提高解码器的提取准确率.同样,相同条件下基于Im-Redisual 结构的编码器也显示了比其他编码器更高的容量和较小的失真.由表2 可知,无论在哪种嵌入率下,HCGAN 模型总是显示出较优的性能.

表2 不同编码器-解码器结构下各个算法的失真和容量Tab.2 Distortion and capacity of each algorithm under different encoder-decoder structures

为了研究神经网络是如何嵌入秘密信息的,本文在6 bpp嵌入率下将HCGAN 算法得到的隐秘图像减去载体图像得到残差图像并将其灰度化,如图7所示.从图7可以看出,HCGAN算法能够自适应地寻找嵌入位置,并在纹理复杂的区域嵌入更多的信息,在平滑的区域嵌入较少的信息.

图7 载体图像(左)、隐秘图像(中)、残差图像(右)Fig.7 Carrier image(left),hidden image(middle),residual image(right)

为了进一步验证HCGAN 算法的泛化能力,本文采用CelebA 和COCO 数据集在1 bpp、3 bpp、6 bpp 的嵌入率下对本文模型进行试验,结果如表3和表4所示.由表可知,本文提出的算法适用于各种不同的图像集并表现良好.

表3 解码器为Dense结构下不同数据集的表现Tab.3 The performance of different data sets under the Dense structure

表4 解码器为Basic结构下不同数据集的表现Tab.4 The performance of different data sets under the Basic structure

3.3 安全性分析

安全性是信息隐藏算法的另一种重要指标,其主要是指抗隐写分析能力,通常使用隐写分析工具的检测率进行评估.本节使用一个流行的开源隐写分析工具StegExpose(结合了几种现有的隐写分析技术,包括样本对、RS 分析、卡方攻击和初级集)进行实验,来验证HCGAN 模型生成不可检测的含秘图像的能力.为了进行对照实验,本文采用LUSN-bed 数据集分别在1 bpp、3 bpp、6 bpp 嵌入率下训练HCGAN 模型和其他结构不变只改变鉴别器为普通卷积结构鉴别器的信息隐藏算法模型.模型训练完成后,分别给各个模型输入1 000个测试集中的图像得到1 000 个隐秘图像,然后使用StegExpose 工具对2 000个图像进行分析并画出ROC曲线,如图8所示.需注意的是,图中的直线表示随机判断的ROC曲线.

从图8 中可以看出,无论是1 bpp、3 bpp 还是6 bpp嵌入率的信息隐藏模型,使用隐写分析器作为鉴别器的HCGAN 算法的抗隐写分析能力总是优于其他结构不变只改变鉴别器为普通卷积结构鉴别器的模型.即使在嵌入率为6 bpp的情况下,StegExpose工具的检测率也低于0.7,可以看出本文算法能够更有效地抵抗基于深度学习的隐写分析算法.

图8 不同嵌入率下的ROC曲线Fig.8 ROC curve under different embedding rates

为了验证本文算法具有抵抗基于深度学习的隐写分析能力,以及避免由于对XuNet 的针对性训练而引起的检测不可信问题,本文使用Yedroudj 等人[29]于2018年提出的Yedroudj-Net隐写分析模型来检测本文模型的抗隐写分析能力,结果如表5 所示.需要注意的是,Yedroudj-Net 在训练时采取半盲检测方式,其训练集中包含各种嵌入率下分别由普通卷积结构的鉴别器和基于隐写分析的鉴别器引导的基于Im-Residual结构的编码器所生成的含秘图像.

从表5 中可以看出,在1 bpp、2 bpp 等较低嵌入率下基于隐写分析的鉴别器引导基于Im-Residual结构的编码器生成的含秘图像有着较低的检测准确率.在5 bpp和6 bpp的高嵌入率下,由于载体图像中嵌入了大量秘密信息所带来的大量扰动,从而使Yedroudj-Net 隐写分析器能够实现接近100%的检测准确率.

表5 Yedroudj-Net隐写分析网络的检测准确率Tab.5 The detection accuracy of Yedroudj-Net steganalysis network %

最后,本文在Yedroudj-Net 隐写分析模型下比较了HCGAN 算法和经典信息隐藏算法WOW、SUNIWARD 在相似安全性下的嵌入率,结果如表6 所示.注意,这里的训练集包含各嵌入率下分别由普通卷积结构的鉴别器和基于隐写分析的鉴别器所生成的含秘图像(作为负向样本)和载体(作为正向样本).从表6中可以看出,本文提出的信息隐藏算法能够在嵌入率为2.0 bpp 下显示出比WOW 和SUNIWARD 算法在0.4 bpp 的嵌入率下更低的隐写分析检测率,即更高的安全性.这进一步验证了本文提出的信息隐藏模型能够实现高隐写容量并且在高隐写容量下保持较强的安全性.

表6 相似安全性下各个算法的嵌入率对比Tab.6 Comparison of the embedding rate of each algorithm under similar security

4 总结与展望

本文提出了一种基于GAN 的高容量信息隐藏算法HCGAN,该算法能够以较高的提取率隐藏高容量秘密信息,并具有一定的抗隐写分析能力.实验表明,HCGAN 算法能有效嵌入3 bpp 以上高容量的秘密信息,并且在高容量下依旧具有较强的安全性.

信息隐藏技术常因新的创意或者其他领域的进展而有长足的发展.结合本文工作,本节提出了未来研究信息隐藏技术的一些思路.本文提出的模型利用了GAN 的对抗性,但没有关注GAN 能通过噪声生成符合真实图像分布的图像生成能力.因此将GAN的图像生成能力用于信息隐藏领域是后续研究的一个方向.本文提出的模型虽然拥有较高的安全性,但还是有可能被隐写分析检测出来.在近几年对于神经网络的研究中,有部分研究者发现对一张已经正确分类的图片进行细微的像素修改后,DNN 会将其错误地分类为其他类型[30].在今后的工作中,将这种对抗性样本引入信息隐藏技术,使基于深度学习的隐写分析将含秘图像错误分类,以此来进一步提高含秘图像的抗隐写分析能力.

猜你喜欢
解码器编码器载体
创新举措强载体 为侨服务加速跑
融合CNN和Transformer编码器的变声语音鉴别与还原
科学解码器(一)
设定多圈绝对值编码器当前圈数的方法
转炉系统常用编码器选型及调试
科学解码器(二)
科学解码器(三)
坚持以活动为载体有效拓展港澳台海外统战工作
舞台机械技术与设备系列谈(二)
——编码器
线圣AudioQuest 发布第三代Dragonfly Cobalt蓝蜻蜓解码器