古籍图像复制粘贴篡改检测SURF算法改进分析

2021-11-05 09:02王永飞王春
六盘水师范学院学报 2021年4期
关键词:像素点高斯古籍

王永飞 王春

(1铜陵职业技术学院,安徽 铜陵 244061;2铜陵市第四人民医院,安徽 铜陵 244000)

随着计算机应用技术的飞速发展,作为信息重要载体的图像使用越来越普遍,根据实际需要,对图像进行篡改也越来越普遍。古籍是学术传承的历史见证和源头活水,更是现代科技创新和学术进步的根基和依据,为加强古籍保护工作,2007年国务院办公厅发布了《关于进一步加强古籍保护工作的意见》,正式实施“中华古籍保护计划”。古籍图像是古籍文物中重要组成部分,古籍图像一般都价值不菲,且是不可再生的珍贵历史文物,若对古籍字画篡改图像,可能使这些古籍图像失去本来的价值和意义,对古籍图像篡改检测显得尤为重要。

古籍图像经过长期自然环境和人为因素的影响,大多数都存在破损严重,经过篡改技术处理后,很多篡改后的图像可以达到以假乱真的地步。当前,图像篡改检测技术主要有特征点匹配和块匹配方法。华秀茹等[1]225-230提出了SLIC超像素分割和SURF特征点RANSAC(Random Sample Consensus)剔除误匹配算法实现图像复制粘贴篡改检测,提高了准确率和检测速度;郑佳雯等[2]194-199利用非抽样小波变换(UWT)提取图像低频部分,对于重叠块提取其快速切比雪夫矩特征,利用Patch-Match特征块匹配算法实现复制粘贴篡改检测,对单区域、多区域篡改区域有很好的定位结果;范晖等[3]1051-1057提出了基于圆域分割耦合法则的图像篡改检测算法,算法利用邻域圆构建特征点,实现图像篡改匹配检测,检测准确性较高,鲁棒性较好。LYU等[4]345-350设计了一种SIFT(scale-invariant feature transform,SIFT)的复制粘贴篡改检测算法,易出现错误检测和漏检测,且存在计算量大等问题。SURF(speed up robust feature,SURF)算法改进了SIFT算法,提高了运算速度,但匹配精度不高。针对上述各算法的不足,此文提出一种改进的SURF算法,能够实现高准确性和快速地检测古籍图像篡改信息。

1 算法篡改检测思路

像素、纹理和结构,灰度和颜色是构成图像的主要信息。特征点是图像中具有尺度不变性的像素点或像素块。SURF算法图像匹配检测过程是:先用高斯滤波平滑图像,找出图像的特征点,构造Hessian矩阵;定位特征点、确定特征点主方向和特征描述子,再进行利用欧式距离最近最佳匹配原则进行特征点匹配,实现图像匹配检测。该文的算法思路是:(1)以SURF算法为基础;(2)分析高斯滤波的不足和像素信息,引入小波变换并改进,对古籍图像进行滤波,平滑图像并更彻底地清除干扰图像特征点提取中的无关斑点,构建更精准的Hessian矩阵;(3)分析SURF算法全图搜索定位特征点的缺陷和图像结构、灰度和颜色特征,引入简单线性迭代聚类(Simple Linear Iterative Clustering,SLIC)算法,对图像分块,提高图像特征点定位速度;(4)分析SURF算法特征点匹配时阈值选取方法的不足,将SURF算法特征点欧氏距离最近最佳匹配原则的阈值选取方式改进为图像特征点匹配自适应统一阈值选取方法,减小特征点匹配误差积累;(5)除改进图像特征点匹配自适应统一阈值选取方式外,再引入图像局部色彩方差,提升图像特征点的匹配准确度;(6)根据特征点匹配情况,利用形态学腐蚀膨胀操作,实现篡改信息定位。通过上述6个步骤,以快速准确地方式实现图像篡改信息检测。图1是图像篡改检测算法流程。

图1 算法篡改检测思路

为验证该文算法检测效果,与当前主流篡改算法检测效果比较,分别对:(1)两幅古籍图像人为篡改进行检测,比较篡改检测前后图像匹配情况,验明该文算法有效性;(2)对2幅古籍文字篡改和缺少笔画的图像进行检测,验明该文算法实用性;(3)对单幅原始图像中多出的鸟进行篡改检测,验明该文算法通用性;(4)分析主流不同算法对上述各篡改图像检测数据分析,验明该文算法的高效性。

2 基于改进的SURF古籍图像复制粘贴篡改检测算法

2.1 SURF算法简介

2.1.1构建Hessian矩阵

图像特征点是图像稳定的关键点,图像Ⅰ上像素点(x,y)即为函数值f(x,y)。图像中含有很多噪声斑点,传统SURF算法选用二阶标准高斯函数对其进行高斯平滑滤波,消除无关噪声斑点,再构建由图像特征点构成的Hessian矩阵,滤波后Hessian矩阵为:

其中,σ表示像素点(x,y)对应的空间尺度;Lxx(x,y,σ)等共四项是高斯函数与高斯二阶偏导数卷积。

Hessian矩阵判别式为:

其中,ω为加权系数,为平衡方型滤波器近似所带来的误差,一般取值为0.9;Lyy、Lxx和Lxy是yy、xx和xy方向上二阶导数值。

2.1.2 确定特征点

在二维图像空间和尺度空间中,将Hessian矩阵与该邻域内相关性像素点比较,滤除能量弱的和定位错误的关键点,选出稳定的特征点;在特征点邻域内,使用harr小波计算60度扇形内水平方向和垂直方向所有点harr小波特征和,再统计以一定间隔旋转后该区域内harr小波特征值,以该值最大的扇形方向确定为该特征点主方向;以特征点为中心,构造一个20pixel*20pixel的正方形窗口,再将该窗口划分为4pixel*4pixel子区域,在每子区域内按照5pixel*5pixel进行取样,计算子区域内水平和垂直方向Harr小波∑dx、∑│dx│、∑dy和∑│dy│共四个响应量值。16个子区域,每子区域4个量值,形成64个特征描述子表达特征点[1]226。

2.1.3 特征点匹配

计算两个特征点间的欧式距离,欧氏距离越短,两个特征点匹配度越高;若两个特征点矩阵迹的正负号一样,表示该对特征点相同方向上对比度变化相同,这两个特征点匹配,否则,即使欧氏距离为0,也认定是误匹配。

2.2 改进SUFR算法

2.2.1 引入小波变换并改进

2.2.1.1 小波变换简介

若f(t)∈L2(R),连续小波变换可为:

传统小波去噪采用阈值函数选取阈值,常用的硬阈值和软阈值函数分别如下:

式中:wjk为含噪图第j尺度下第k层小波系数,sgn(·)是符号函数,是小波系数近似估计,λ是阈值。传统的小波选取统一阈值,λ取值公式为:

其中:σ是噪声标准差,N是图像大小。

小波重构函数可定义为:

2.2.1.2 改进小波阈值选取方式

由于各种原因,古籍图像都包含大量噪声,而噪声在图像中表现为很强的孤立像素点(斑点)。在图像特征点提取过程中,这些孤立像素点容易被视为图像的特征点提取,影响图像篡改区域的定位。构建Hessian矩阵过程中需要使用高斯函数对其进行滤波,高斯函数在频域内的具有图像平滑作用,且频率点半径决定了图像边缘信息滤除多少和图像模糊程度,是否出现振铃现象。该文算法引入改进的小波变换算法,以克服高斯滤波的不足。

硬阈值去噪将噪声小波系数直接清零,容易产生伪吉布斯现象;软阈值去噪时,估计值与实际值之间存在一定偏差,影响图像重构效果;另外,还有如折中阈值去噪等方法,图像中都容易出现断点,平滑度不够。

为了更好地实现图像滤波,改进小波阈值函数如下:

改进阈值选取方式如下:

其中:Ti是第i层阈值,m是调节阈值函数的常量[5]33-38。

2.2.1.3 改进小波变换与高斯函数滤波效果比较

高斯函数滤波是一种图像低频高斯噪声滤波方法。古籍图像包含噪声种类多,噪声在图像低频区和高频区都有,且图像高频区噪声所占比例较大。小波变换具有低频低时间分辨率高频率分辨率,高频有高时间分辨率低频率分辨率等特性,通过选择不同的母函数,对图像进行尺度分析,在各尺度上从粗及精分析图像中大量的细节信息。因古籍图像噪声强度大小分布非线性,故采用改进小波阈值选取方式实现图像噪声斑点清除的同时,抑制图像伪吉布斯现象和断点出现。

通过对图像添加标准差为1.6的高斯噪声,利用改进的小波变换滤波和高斯函数滤波,就滤波效果图进行分析,如图2所示。

图2 图像滤波效果比较

从视觉效果角度看,高斯滤波图图像过于平滑,且比较模糊;该文算法滤波后,图像最接近原图,且图像信噪比达到75.32dB,结构相似度为0.91,远高于高斯滤波后的图像信噪比64.57dB和图像结构相似度0.64,这为构建Hessian矩阵提供了更好的基础。

2.2.2 改进超像素分割算法SLIC

将图像分割的目的是减少检测时间,提高检测效率。该文算法中引入超像素分割方法之一的简单线性迭代聚类(Simple Linear Iterative Clustering,SLIC)算法,由于SLIC分割的超像素块大小均匀,且分割前需要设定图像分割数目。图像分割数量过大或过小,会增加时间复杂度或降低了检测精度。

2.2.2.1 超像素分割算法SLIC及改进

(1)超像素分割算法简介超像素分割算法SLIC是一种基于网格化针对像素块K-Means聚类[6]20的超像素图像分割算法。因Lab颜色空间与设备无关,将图像RGB颜色空间转换到Lab颜色空间(Lab颜色模型由亮度(L)、颜色通道a和b组成),每个像素点(x,y)可用5维向量V[L,a,b,x,y]表示。

(2)超像素分割算法改进

为了消除SLIC分割图像前分割数量假设的不确定性,该文算法利用自适应确定超像素图像分割数量。通过小波变换,提取图像低频分量和高频分量,计算小波对角对比度[7]314,计算公式为:

式中,图像的像素点(x,y)块对角高频分量和低频分量分别是D13(x,y)和A1.

自适应确定超像素图像分割数量为:

式中,M×N是图像的长和宽。

改进后的SLIC算法过程:在原图N个像素中,自适应确定超像素图像块分割数量K,选取K个图像特征点,设为K聚类中心,以每个特征点为中心,搜索全图欧氏距离最近的像素点,并归入该类,计算每类像素点平均向量值,重新得到K个聚类中心,再以这K个中心去搜索周围其最为相似的像素,反复迭代,至所有像素都归类后收敛。若聚类中心在边缘或是噪声点,改进为将聚类中心移动到梯度最小的区域。图3为SLIC算法图像分割过程和结果。

图3 SLIC算法图像分块

2.2.3 图像匹配自适应阈值选取

张鹏等[8]12-14提出了从符号检验出发,在理论上推导出分位点在样本容量和显著性水平一定时的最短区间估计模型,但这只是理论上推导。传统SURF算法采用欧氏距离最近最优原则判断特征点的匹配,判断公式为:

其中:n为特征点维数,x1和x2分别为原图像和待测图像特征点描述向量。l为两特征点间的距离。

以最近特征点和次近特征点的距离比值为阈值,当lmin>lsecond时,保留最近特征点。显然,这种阈值在SURF特征点匹配时精度不高。

该算法采用统一阈值法:(1)先分别求出原图和待测图像所有特征点;(2)再用循环方式求出原图所有特征点与待测图像所有特征点之间距离,将最近特征点和次近特征点距离值作为阈值。将该阈值作为全图匹配的统一阈值,以减小匹配过程中阈值变化产生的误差,提高图像匹配精度。

图4就两幅前景完全相同,背景的色调、对比度和饱和度都不同的图像进行匹配检测比较。利用传统SURF算法和改进后的该文统一阈值法对两幅图像进行篡改检测,结果如图4所示。

图4 两种算法匹配检测比较

两幅图像只有背景不同,(c)图是利用传统SURF算法匹配检测结果,图中鸟的特征匹配点只有三对,与事实明显不符,表明传统SURF算法匹配检测存在很大的误差,(d)是利用该文算法篡改匹配检测结果图,很明显篡改匹配检测结果更准确。

2.2.4 引入提高匹配准确度的图像局部色彩方差

近年来,图像特征点检测的主流算法,如Harris、SIFT和SURF等算法均忽视了图像颜色信息,检测出的特征点均存在误差,该文在SURF算法特征点匹配时引入图像局部色彩方差,除要求欧氏距离越短和两个特征点矩阵迹的正负号一样外,还要求判断两特征点的局部色彩方差是否相同,以提升匹配检测的准确度。

因HSV图像模式更符合视觉效果,且空间各分量相对独立,该文算法将RGB图像颜色模式转换为HSV图像模式。图像局部色彩方差反映图像细节复杂度,故引入图像局部色彩方差E(p),将其作为判断特征点匹配的重要依据。

设ψф(p)是超像素ψp区域,S((p))是ψp色彩值,S(ψф(p))是ψp色彩均值,超像素块的局部色彩方差计算公式为[9]116:

使用改进后的算法和传统SURF算法分别对两幅篡改后图像进行匹配检测,结果如图5所示。

图5两种算法匹配检测比较

图5 中,(a)是原始图;(b)是原始图右边人脸篡改后的图像,(c)是利用传统的SURF算法对篡改后的图像匹配检测效果,图中明显出现了肩部误匹配特征点对应线,且该匹配对应点颜色明显不一样;(d)图中的匹配更为准确。

2.2.5 篡改信息定位

将根据特征点匹配后的古籍图像二值化,利用形态学腐蚀膨胀操作填充匹配特征点对之间空隙形成连通区域。选用经典结构元素B,表达式为:

针对图像I二值化后的A图像,利用表达式:

进行篡改区域检测显示如图6所示。

图6算法篡改检测结果

图6 中,(c)图是根据特征点匹配后,使用形态学腐蚀膨胀操作篡改定位的图像,因(b)图中人脸篡改部分和原始图像(a)人脸部分有很多像素点完全相同,且信息完全相同部分不能认定被篡改,故(c)图中显示的是被篡改部分的准确位置信息。

3 实验与分析

该文算法使用的系统平台为windows7 32位旗舰版,软件应用平台为matlab2015b,以其中一幅图像人为篡改的两幅图像和内容有篡改的单幅图像为例,篡改方式包括复制、缩放、旋转、更换背景和删除等,更换背景的篡改检测验证在前文以论证过,此处不再累述。利用该文算法与其他当前主流算法对篡改图像检测,分析结果,验证该文算法的实用性,通用性和高效性。

3.1 两幅古籍图像篡改匹配检测

3.1.1 复制篡改匹配检测

为验证图像复制篡改匹配检测,选用两幅古籍图像,如图7所示,(a)中右图人脸部明显破损,现将(a)中左图人脸不作任何调整地复制到右图人面处,成图(b)中右图,该文算法、华秀茹等[1]、郑佳雯等[2]和彭双等[10]算法对篡改进行匹配检测,结果如图7所示。

图7 多种算法图像复制篡改匹配检测比较

图7中,原始图(a)中左右两图像从视觉角度上看,图像相似,但两图的颜色信息完全不同。华秀茹等[1]篡改匹配检测效果明显优于郑佳雯等[2]和彭双等[10];华秀茹等[1]和郑佳雯等[2]匹配均出现多匹配现象,原因是没有对图像色彩进行判断;彭双等[10]的篡改匹配检测效果图中人脸匹配对应点只有两对,这是明显的匹配错误,后面实验将彭双等[10]篡改匹配检测结果忽略。该文算法能精准定位匹配,效果最佳。

3.1.2 放大和旋转篡改匹配检测

图8是继续将上述两幅古籍原始图像左图人脸复制放大20%后移至(a)中右图的人脸部,结果如图8(b)的右图所示。

图8多种算法图像放大篡改匹配检测比较

图8 (c)(d)和(e)是该文算法、华秀茹等[1]和郑佳雯等[2]篡改匹配检测结果。

图9是继续将上述两幅古籍原始图像(a)右图人脸复制后顺时针旋转20度并移至(a)右图人脸位置,结果如图9中(b)的右图所示。

图9 多种算法图像旋转篡改匹配检测比较

由图8和图9可知,该文算法、华秀茹等[1]和郑佳雯等[2]篡改匹配检测结果很稳定,且算法匹配检测结果表明,该算法检测匹配准确性明显高于华秀茹等[1]和郑佳雯等[2]。此外,就图像篡改任意比例缩放和任意角度旋转待情况进行了实验,实验结果证明该算法实用性更强。

3.2 单幅古籍字帖图像篡改检测

为了验证算法的通用性,在选取单幅古籍字帖图像时,选取了其中有重复字“樂”的图,同时,将原始图像(a)中的“如”篡改为“何”,利用算法就篡改文字进行匹配检测,匹配检测结果如图10(c)所示。

图10该文算法文字图像篡改匹配检测

图10 (c)中,检测出了原始图(a)中两个同样的字“樂”的匹配,因写作手法不同,同样的字只有个别的地方匹配,而篡改后的同样两个字“何”完全匹配。表明该文算法通用性强。

图11中就原始图(a)中“綠”字少了一横,从其他图中复制缺的“横”图案粘贴到图(b)中的位置,利用算法进行篡改检测,获得篡改区域信息图像如(c)所示,从视觉效果角度分析,篡改区域图像清晰度非常高;证明了该文算法通用性强。

图10和图11就古籍字帖进行篡改匹配检测。为进一步验证算法通用性,选用单幅原始图中有多只鸟的图像进行篡改,利用该算法进行匹配检测。

图11 该文算法图像篡改区域显示

图12该算法图像篡改检测匹配

图12 原始图(a)的图像中有多只鸟,仅复制图中最上面的一只鸟并粘贴至图中间的树枝上,同时,将粘贴后的图像缩小5%,利用该算法进行匹配检测,结果如图(c)所示,由匹配效果图知,匹配准确度高效果非常高。

3.3 准确率和用时

就图像12利用该文算法、华秀茹等[1]和郑佳雯等[2]检测匹配检测结果统计如下:

由表1知,华秀茹等[1]对应点匹配准确率较郑佳雯等[2]高,但检测用时较长;郑佳雯等[2]检测用时最短,但准确率不高;该文算法检测准确率最高,检测用时最少。表明该算法的高效性。

表1 3种算法篡改匹配数据统计

4 结论

该文提出了一种对SURF算法作出改进的图像复制粘贴篡改匹配检测算法,巧妙地利用改进的小波变换替换高斯滤波并消除图像中的噪声斑点,并自适应确定SLIC分割图像数量;以全图特征点与次特征点比值作为匹配判断阈值代替传统SURF算法的阈值选取;引入了图像局部色彩方差,弥补SURF算法对图像色彩的忽略的缺陷,全面完整地实现图像复制粘贴篡改匹配检测,与当前多种主流算法比较,图像分割更精准,减少了大量的误匹配,图像篡改区域匹配更精确。通过实验分析,算法的有效性、实用性、通用性和高效性得到了验证。后继将就单像素图像损伤算法进行深入的研究。

猜你喜欢
像素点高斯古籍
图像二值化处理硬件加速引擎的设计
中医古籍“疒”部俗字考辨举隅
基于局部相似性的特征匹配筛选算法
西藏大批珍贵藏文古籍实现“云阅读”
数学王子高斯
天才数学家——高斯
基于像素点筛选的舰船湍流尾迹检测算法
基于canvas的前端数据加密
我是古籍修复师
从自卑到自信 瑞恩·高斯林