基于MCM和HVS的彩色图像盲隐写分析算法

2013-08-04 02:23白求恩军医学院基础部石家庄050081

计算机工程与应用 2013年11期

关键词：彩色图像空域分量

1.白求恩军医学院基础部，石家庄 050081

2.军械工程学院计算机工程系，石家庄 050003

1.白求恩军医学院基础部，石家庄 050081

2.军械工程学院计算机工程系，石家庄 050003

1 引言

隐写分析作为隐写术的对抗技术，目的是揭示出隐密载体中秘密信息的存在，进而进行提取、篡改或破坏。通用隐写分析是通过机器学习和监督学习实现待测对象的两分类：载体对象（不含密对象）和含密对象，以达到隐写检测的目的。盲隐写分析因其适用范围较广，并且在实现方法上更符合隐写分析研究的实情，而成为隐写分析技术研究的重点和难点。典型Shi等人算法[1]，虽然检测性能高于Harmsen方法，但因特征量之间存在较强的相关性，故误检率较高；Farid将JPEG图像解压到空域，提取预测误差图像高阶统计矩作为敏感特征[2]，特征间冗余较大，并且因图像格式的转换，人为改变了图像本身的属性，致使隐写检测性能一般；Fridrich基于DCT域边界不连续性，提出了多特征JPEG图像隐写分析算法[3]，算法直接从图像压缩域和空域抽取特征，故综合性能高于Farid，但因其通过提取空域共生矩阵描述量化DCT系数之间计算复杂度较大；之后，Y.Q.Sh i、DongDong Fu等采用马尔科夫链模型[4-5]，通过捕捉块内、块间DCT系数之间的相关性，并建立水平、垂直两个方向MC模型，取得了较好的检测效果，但对整个DCT系数之间相关性的描述上欠全面，某种程度上影响了隐写检测的准确性。为此，Pevny等人融合Fridrich和Y.Q. Shi两种方法[6]提取敏感特征量，有效实现了盲隐写域的多分类，但因采用空域共生矩阵作为初始敏感特征集的一部分，同样存在计算复杂度较大的问题。此后，李卓等人使用相邻DCT系数的联合概率密度，并将其扩展到DWT域和空域[7]，提出一种基于多特征的JPEG图像盲检测算法，尽管运算时间有所改进，但受嵌入率的影响较大。本文在对典型算法进行研究的基础上，针对其中的不足，采用“相关性”和“多特征融合”的思想，改进敏感特征生成方法，提取高敏感特征统计量，然后引入PCA技术，实现初始特征集的选择优化，生成有效的分类特征矢量集空间。最后，基于Matlab7.0平台，采用非线性核SVM分类器进行仿真实验，给出算法的有效性验证。

2 主要理论分析

JPEG图像是互联网上应用非常广泛的一种压缩格式，因其压缩性能优良，获取方便，深受隐写和隐写分析研究者的关注，并且成为研究的重点。JPEG图像直接压缩域是YCbCr模型空间的Block-DCT域。通常情况下，秘密信息的隐写嵌入是通过改变直接压缩域的量化DCT系数来实现，但此种改变对空域相邻像素之间的相关性也有一定的影响。

马尔科夫链模型（MCM）是用于描述随时间进化的后效性系统。在图像处理和模式识别领域一般采用参数和状态空间均离散化的Markov过程，此过程被称为马尔科夫过程或马氏链[8]。设{X(t)，t∈T}为时间t和所对应的状态 Xt均离散的随机过程，时间集T为非负整数，其状态空间记为 I={i0，i1，…，in}。若对任意 m，k，n∈N，N 为非负整数，iv∈I，v=0，1，…，n+1，有式（1）成立，则称此过程{X(t)，t∈T}为马尔科夫链，并且具有马尔科夫性。

若式（1）右端记为Pij(m，m+k)，则马氏链转移到状态im+k的概率：

当转移概率仅与i，j和k有关，则此概率具有平稳性：Pij(m，m+k)=(P(m，m+k))，且矩阵每一行元之和为1。自然图像的随机过程具有无后效性特点，满足MCM要求，且随机变量的概率随空间状态的改变而改变。因此可用MCM模型刻画其分布特性。

PCA技术是将多个特征映射为少数几个综合特征的一种统计方法。对于一个n维随机变量x，如果各变量之间存在相关性，x中便存在冗余，则可采用PCA技术实现特征压缩，消除彼此间的冗余。在盲隐写分析技术的研究中，“多特征”融合虽然提高了检测性能，但因特征数量的增加，易造成纬数“灾难”，并且特征之间存在一定的冗余度。因此采用PCA技术实现分类特征矢量集空间的选择优化，有利于提高分类特征的有效性，进而提高算法的综合性能。

3 JPEG彩色图像通用隐写分析算法

3.1 设计8邻域相关性MCM

JPEG彩色图像直接压缩域是Block-DCT域。图像经DCT变换后，DCT系数矩阵绝对值，沿左上角到右下角方向依次递减。其低频系数分布于左上角，是图像的主要信息，反应了图像的主要轮廓；高频系数分布于右下角，是人类感觉最不敏感的信息，并且交流系数服从广义高斯分布或拉普拉斯分布。对于JPEG直接压缩域而言，每一小块均具有上述分布特征，因此，不仅块内DCT系数之间存在较强的相关性，而且不同块，但同位置、同方向的DCT系数之间同样存在着较强的相关性，此种相关性可通过建立多邻域MCM理论进行描述。

数字图像是一个位置和状态都离散的随机信号，可被看作一种随机信号，并且满足MCM模型限制条件。为全面而准确地描述DCT系数之间的相关性，算法设计8-邻域相关性MCM模型，联合建立块内、块间多条马尔科夫链。块内DCT系数和整个块间扫描模式分别见图1和图2。整体DCT系数二维排列方式见图3。

图1 块内DCT系数四种扫描模式

图2 块间四种扫描模式

图3 整体DCT系数二维排列

因JPEG彩色图像模型空间为YCbCr，此空间将HVS完全分离，其中Y是亮度分量，类似于RGB空间的灰度分量，含有丰富的图像信息，在此分量嵌入秘密信息不易引起载体图像的失真，并且承载嵌入容量较CbCr分量大，并且安全性较高。所以，通常情况下，隐写分析将秘密信息主要隐藏在Y分量的Block-DCT域。又因为YCbCr模型空间分量与RGB模型空间三个通道相对应。因此，进行8-邻域相关性MCM模型设计时，也要考虑其相应的空域像素值之间的相关性。扫描方式与图1相同。

3.2 构建高敏感有效分类特征向量

高敏感特征是指对隐写嵌入数据极度敏感，而对原始载体数据不敏感的特征。如果特征提取是在隐写数据嵌入直接操作域进行，则有利于提高其敏感性。为进一步提高敏感特征的泛化能力，将预测误差图像的YCbCr模型空间Y分量、Y分量对应的RGB三通道作为隐写分析域，然后基于8邻域相关性MCM模型和PCA技术构建高敏感有效分类特征向量。计算公式：

式中，J为待测图像，J1代表预测图像，F(.)则代表相应图像的特征。F(.)为特征向量。

（1）生成预测图像、确定状态空间。首先依据JPEG图像压缩原理和量化Block-DCT系数分布特性，采用HMT模型生成预测图像[9]，然后为提高计算效率，并且将信息丢失控制在最少，参照文献[4-5]中方法确定状态空间[0 T]。实验从标准图像库中任意选取20幅图像，采用不同的量化因子（80～95），计算DCT系数绝对值的百分比，结果发现在T等于14时，信息保留百分比为99.05%，当T大于14时，信息保留量变化极为缓慢，因此均衡考虑后取T=14。

（2）提取变换域高敏感特征。因空域像素的马尔科夫状态转移矩的值主要集中在主对角线附近，而DCT变换系数相应值的集中性则相对弱一些，分别见图4和图5。因此，分别在YCbCr模型空间Y分量，抽取量化DCT系数的的Markov状态转移矩作为主特征；在Y分量对应的RGB三通道抽取Markov状态转移矩主对角线邻域相似熵作为辅助特征，二者进行合理“绑定”后，共同组成初始特征集。

图4 空域状态转移矩分布情况

图5 DCT域状态转移矩分布情况

块间DCT系数状态转移矩计算公式：

（3）空域高敏感特征提取。Y分量对应于空域RGB三个通道的状态转移矩计算公式：

（4）计算最终特征。按照式（3）进行最终特征的计算，特征函数见表1。

表1 最终特征函数

（5）构建高效分类特征向量。为降低特征维数，消除冗余特征，基于PCA技术对特征向量Fvector，jpeg进行优化处理，然后根据特征的贡献率，确定用于实现通用隐写检测的有效分类特征矢量集Fˆvector，jpeg。特征向量：

4 实验结果与分析

实验所用自然图像源于两部分：一部分是数码相机拍摄图像；另一部分是互联网标准图像库图。共选取图像1 000幅，大小为256×256，格式为JPEG。在进行实验时，首先从1 000幅图像中，选取500幅作为原始载体图像，分别采用Jsteg、F5、Outguess、MB1、MB2进行秘密信息的嵌入，生成500幅隐秘图像，并采用HMT模型生成500幅预测误差图像，然后根据提出方法计算500幅载体图像和相应预测误差图像特征矢量集作为训练集样本，并引入PCA技术进行降维处理，生成有效特征分类子集。按照同样的方法，生成1 000幅图像的特征矢量集作为测试集样本。最后采用RBF非线性核SVM实现待测样本的分类检测。实验共得到敏感特征706维，应用PCA技术进行选择优化处理后，提取前204维特征构成分类特征有效特征矢量集，对不同嵌入量下F5、Outguess、MB1、MB2隐秘对象实施检测，所得结果见表2，ROC性能曲线见图6。

表2 不同嵌入率下的检测正确率

图6 典型隐写检测算法ROC性能曲线

从表2和图6可以看出：提出算法的检测正确率优于典型Farid、Q.Shi算法，且随着秘密信息嵌入容量的增加，其检测正确率逐渐增高、检测错误率逐渐降低，适用范围优于典型Farid算法。

5 小结

在对JPEG彩色图像特性、隐写嵌入域及其DCT域相关性等进行全面研究分析的基础上，基于MCM和HVS提出了一种JPEG彩色图像盲隐写分析算法。仿真实验结果表明：该算法在实现对Jsteg、F5、Outguess、MB1、MB2隐写攻击方面，可靠性强、正确率高，并且优于典型的Farid、Q. Shi算法。

[1]Shi Y Q，Xuan G R，Zou D，et al.Image steganalysis based on moments of characteristic functions using wavelet decomposition，prediction-errorimage，and neuralnetwork[C]// Proceedings of 2005 IEEE International Conference on Multimedia and Expo，Amsterdam，2005：269-272.

[2]Lyu S，Farid H.Steganalysis using higher-order image statistics[J].IEEE Transactions on Information Forensics and Security，2006，1（1）：111-119.

[3]Fridrich J，Pený T.Multi-class blind steganalysis for JPEG images[C]//Proceedings of SPIE Electronic Imaging，Security，Steganography，and Water mark in gof Multimedia Contents VIII，2006.

[4]Shi Y Q，Chen C，Chen W.A Markov process based approach to effective attaching JPEG steganography[C]//Proceedings of the 8th Information Hiding Workshop，2006.

[5]Fu D，Shi Y Q，Zou D.JPEG steganalysis using empirical transition matrix in block DCT domain[J].IEEE，2006.

[6]Pevny T，Fridrich J.Merging Markov and DCT features for multi-class JPEG steganalysis[C]//Proc SPIE，2007.

[7]李卓，陈健，蒋晓宇，等.基于多域特征的JPEG图像盲检测算法[J].浙江大学学报：工学版，2011，45（9）：1528-1537.

[8]盛骤，谢式千，潘承毅.概率论与数理统计[M].3版.北京：高等教育出版社，2001.

[9]刘晓芹，王嘉祯，徐波，等.基于HMT和ICA的主动隐写分析[J].武汉大学学报：信息科学版，2008，33（10）：1059-1060.

[10]冯帆，王嘉祯，马懿，等.基于HMT的Block-DCT域隐写图像移出攻击[J].计算机应用与软件，2009，26（11）：274-275.

基于MCM和HVS的彩色图像盲隐写分析算法

冯帆1，2，王建华1，张政保2，王惠萍1，戚红军1

FENG Fan1，2,WANG Jianhua1,ZHANG Zhengbao2,WANG Huiping1,QI Hongjun1

1.Foundation Department,Bethune Military Medical College,Shijiazhuang 050081,China
2.Department of Computer Engineering,Ordnance Engineering College,Shijiazhuang 050003,China

Aiming at the problem that comprehensive performance of typical steganalysis isn’t perfect,which is caused by a lack of characterizing relativity in DCT domain,a blind steganalysis algorithm for JPEG color images is proposed fusing MCM and HVS.It devises an 8-neighborhood MCM model to describe comprehensively the distribution characteristics of DCT coefficients.The model is used for extracting sensibility features statistic based on HVS,which are Markov transition probability matrices of the Y component in the model space of YCbCr,and the main diagonal similitude entropy of the corresponding RGB of Y component,then these feature statistics are in reason merged.PCA technology is applied to optimize original features,and construct effective classified features eigenvector.The experimental results show that the presented method can achieve higher reliability and accuracy rate,aiming at Jsteg、F5、Outguess、MB1、MB2 steganography.

Markov Chain Model（MCM）;Human Visual System（HVS）;color images;steganalysis

针对典型算法在描述DCT域相关性方面存在的不足，所引起的隐写检测综合性能不理想的问题，将MCM与HVS进行有机结合，提出一种JPEG彩色图像通用隐写分析算法。设计8-邻域MCM型，全面描述DCT系数之间的相关性，基于HVS分别在YCbCr模型空间Y分量抽取Markov状态转移矩、在其相应RGB三通道抽取Markov状态转移矩的主对角线邻域相似熵作为特征统计量，并进行合理“绑定”，采用PCA技术对其进行优化选择，构建高效分类特征向量。实验结果表明该算法对于Jsteg、F5、Outguess、MB1、MB2攻击具有较高的可靠性和检测正确率。

马尔科夫链模型（MCM）；人类视觉系统（HVS）；彩色图像；隐写分析

TP393

10.3778/j.issn.1002-8331.1203-0014

FENG Fan,WANG Jianhua,ZHANG Zhengbao,et al.Blind steganalysis algorithm for JPEG color images based on MCM and HVS.Computer Engineering and Applications,2013,49（11）：72-75.

河北省基金项目（No.052135，No.11213527D）。

冯帆（1971—），女，博士，主要研究方向为信息安全；王建华（1977—），女，博士，主要研究方向为图像处理；张政保（1964—），男，博士，主要研究方向为信息安全。E-mail：fengfan_2357@163.com

2012-03-05

2012-05-28

1002-8331（2013）11-0072-04

CNKI出版日期：2012-08-13 http://www.cnki.net/kcms/detail/11.2127.TP.20120813.1134.004.html