基于SVM的雾天图像分类技术研究

2018-03-26 02:16陈洪亮张生伟万锦锦
电光与控制 2018年3期
关键词:雾天特征向量分类器

李 可, 陈洪亮, 张生伟, 万锦锦

(1.光电控制技术重点实验室,河南 洛阳 471000;2.中国航空工业集团公司洛阳电光设备研究所,河南 洛阳 471000)

0 概述

雾霾天气中气溶胶粒子对成像光线的吸收和散射会导致图像“透光”强度减弱,能见度严重降低,许多特征被覆盖或模糊,直接限制和影响了户外数字成像系统效用的发挥。通过图像去雾技术去除雾霾的影响,恢复物体原有的颜色和细节信息,得到高质量的图像对提高户外数字成像系统工作的可靠性与稳定性具有重大的应用价值[1-2]。然而,现有的图像去雾算法存在自适应能力不足的问题,对不同雾气浓度的图像进行处理时需要手动调整参数,不能满足数字成像系统自适应去雾的需求。因此对图像雾气浓度进行识别与分类,进而根据识别结果自适应地选择图像去雾算法以及参数,对提高去雾算法的自适应能力将具有重要的意义。

目前,雾天图像分类技术研究相对较少,对于雾天图像的描述多是围绕去雾后图像质量评价展开。例如:文献[3]从去雾增强后图像的细节清晰度、色彩还原度和场景结构信息3个方面对去雾后图像的质量进行无参考客观评价;文献[4]提出了一种利用绝对差值和人工合成雾天图像的全参考评价算法和一种利用图像的对比度、色彩的自然度和丰富度的无参考评价算法;文献[5]将去雾后图像质量评价问题转换为分类问题,利用基于图像增强、图像复原、统计先验以及人类视觉系统等的特征和支持向量机分类器对去雾后图像进行分类和质量评价;文献[6]提出了一种基于码书的利用自然场景统计与对比度、梯度、亮度混合特征的无参考雾天图像质量评价算法;文献[7]利用图像功率谱斜率、对比度、噪声和饱和度等特征对图像天气进行分类,区分晴、阴、雨、雾等天气;文献[8]提取图像饱和度的均值、方差为特征,利用K-均值聚类的方法实现对雾天图像的识别;文献[9]提取图像能见度、暗通道强度和对比度为特征实现对雾天图像的识别。

现有的去雾图像质量评价算法从去雾后的细节还原度、色彩还原度等方面对图像质量进行评价,评价的是去雾后图像的视觉效果;天气识别算法只能识别出图像是否是雾天图像,上述算法均不能对原始图像中雾气的浓度进行区分。由于户外数字成像系统工作环境不固定,场景多变,而且许多是移动成像系统,无法使用预设标记物对图像进行距离标定的方法得到能见距离。基于上述研究背景,本文提出了一种基于SVM和混合特征的雾天图像分类算法。通过对训练图像的特征向量集进行有监督学习来形成分类器,最终实现雾天图像的自动识别与分类,其实现流程如图1所示。首先提取训练集中图像的特征向量形成特征数据集,之后人工对训练集中图像进行标记,合并特征数据集形成完整的雾天图像训练数据集,最后使用有监督学习的方法,利用数据集对分类器进行训练,得到雾天图像分类器。对于测试图像,提取其特征向量,输入训练好的雾天图像分类器,利用分类器输出结果确定雾天图像的类别。

图1 雾天图像分类算法流程Fig.1 Flow chart of haze image classification algorithm

1 特征提取

1.1 暗通道直方图特征

文献[10]提出在无雾图像的非天空区域里,若把图像分为多个子块,则每个子块中都会有某些像素点的一个颜色通道的亮度接近于0,即暗通道先验规律。对于任意的输入图像J,其暗通道可以表示为

(1)

式中:Jc表示彩色图像的每个通道,暗通道图像即求出每个像素RGB分量中的最小值的图像。同一个场景,有雾和无雾时原始图像及其暗通道图如图2所示。

图2 原始图像及其暗通道图Fig.2 The original images and their dark channel images

对比图2a和图2b可以看出,无雾图像的暗通道图相比有雾图像的暗通道图,其低像素值所占比例更高。本文使用直方图来定量描述有雾和无雾图像暗通道图中像素值的分布,如图3所示。

图3 暗通道直方图Fig.3 Dark channel histogram

由图3可见,有雾图像暗通道像素值主要分布在100~200的区间中,而无雾图像暗通道像素值主要集中分布在0~100的区间中。如果将暗通道直方图直接作为特征向量来对雾天图像进行分类,特征向量为256维,则维数过高,因此本文提出将256维的暗通道直方图简化得到8维的暗通道直方图(DCH)作为雾天图像的特征向量,即

(2)

图4所示分别是有雾和无雾图像的8维暗通道直方图。

图4 图像暗通道直方图Fig.4 Image DCHs

1.2 小波变换均值特征

雾霾天气中,由于大气散射的影响,有雾图像与无雾图像相比,高频信息减少,细节丰富度降低,因此利用图像的小波变换将图像从时域变换至频域,进而描述图像中细节的丰富程度。图像的小波变换中二维尺度函数和平移基函数分别为[11-12]

φj,m,n(x,y)=2j/2φ(2jx-m,2jy-n)

(3)

(4)

式中:ψH表示沿列方向的变化;ψV表示沿行方向的变化;ψD表示对应对角线方向的变化。大小为M×N的图像f(x,y)的离散小波变换是

(5)

(6)

式中:j0是一个任意的开始尺度;Wφ(j0,m,n)系数定义f(x,y)在尺度J0处的近似;Wiψ(j,m,n)系数对尺度j≥j0附加了水平、垂直和对角方向的细节。图2中原始有雾和无雾图像的三尺度小波变换如图5所示。

图5 图像小波变换Fig.5 Image wavelet transforms

由图5可见,无雾图像小波变换后水平、垂直和对角3个方向上图像的细节丰富度比有雾图像的高,而有雾图像第三尺度近似图像的亮度比无雾图像的高。本文提出一种小波变换均值特征(WLM),使用图像小波变换后的小波系数绝对值的均值和尺度近似系数绝对值的均值作为图像的特征向量来表征图像的细节丰富程度,即

(7)

(8)

对于三尺度小波变换,有9个小波系数均值特征,加上1个尺度近似系数均值特征,共同组成一个10维的特征向量。有雾及无雾图像的小波系数均值特征及尺度近似系数均值特征如图6所示。

图6 图像小波分解均值特征Fig.6 Image WLM

1.3 去均值归一化系数特征

MITTAL等在2012 年提出的BRISQUE算法中使用了去均值归一化系数(Mean Subtracted Contrast Normalized,MSCN)来表示图像的特征[13-14],即

(9)

(10)

(11)

如图7所示,随机选取4幅自然场景的图像,其MSCN系数归一化分布如图8a所示。

图7 4幅自然图像Fig.7 4 natural images

图2中有雾及无雾图像的MSCN系数归一化分布如图8b所示。

图8 MSCN系数归一化分布Fig.8 MSCN normalized distribution

由图8可见,自然场景图像MSCN系数的分布具有明显的规律,对于同一个场景,有雾图像的MSCN系数分布比无雾图像的更集中。先前对自然场景统计的研究表明广义高斯分布(General Gaussian Distribution,GGD)可以表示图像的系数变化,即

(12)

(13)

式(12)中的系数相对来说是一种有规律的分布,但是图像失真等原因会使系数的分布有一定变化,这种变化可以使用不对称的广义高斯分布(Asymmetric Generalized Gaussian Distribution,AGGD)来进行拟合,即

(14)

分布的均值也是参数之一

(15)

通过提取GGD的2个参数α,β以及AGGD的上、下、左、右4个方向上的系数γ,βl,βr,η,共得到18个参数,不同尺度下图像的特征有一定差别,因此在两个尺度下分别提取其去均值归一化系数特征,得到一个36维的特征向量。

2 支持向量机

支持向量机(SVM)是常用的有监督学习分类器,SVM在解决小样本非线性及高维模式分类识别中表现出许多特有的优势。SVM算法的目的就是要寻找一个最优超平面H,使得H不仅能把不同类样本正确分开,而且不同类样本中每个点到H的距离最小值之和达到最大,称为最大间隔,其中,能取到距离最小值的那些样本称为支持向量(SVs)[15]。

以两类数据分类为例, 给定训练样本集(xi,yi),i=1,2,…,l,x∈Rn,y∈{±1},超平面记为(w·x)+b=0,为使分类面对所有样本正确分类并且具备分类间隔,要求满足约束

yi[(w·xi)+b]≥1i=1,2,…,l。

(16)

可以计算出分类间隔为2/‖w‖,因此构造最优超平面的问题就转化为在约束式下求

(17)

(18)

(19)

从而得到最优分类超平面(w*·x)+b*=0,最优分类函数为

f(x)=sgn[(w*·x)+b*]=

(20)

对于线性不可分情况,SVM的主要思想是将输入向量映射到一个高维的特征向量空间,并在该特征空间中构造最优分类面。

3 实验仿真

采用有监督学习的方法时需要首先对图像集进行标定,由于事先没有使用标准能见度测量仪器对图像能见度进行定量标定,所以使用人工对图像进行标记的方法,通过人眼对图像中有雾与否以及对图像中场景距离的判断得到大致的能见距离,将图像分为无雾、轻雾、浓雾3类,对应的气象能见距离分别为10 km以上、0.5 km~10 km和0.5 km以下。

通过搜集和拍摄得到了一个包含657幅图像的图像集,并经过人工对于无雾、轻雾及浓雾的标记。对每张图像分别计算其DCH特征、WLM特征以及MSCN系数分布特征,经过归一化得到一个54维的特征向量,合并得到了特征向量集。

从657幅图像中随机选取438幅图像作为训练集,另外219幅图像作为测试集,利用训练集的特征向量集及其标记对SVM分类器进行训练,测试集的特征向量集输入训练好的SVM分类器,利用分类结果同人工标记的对比计算分类正确率。

本文使用Intel®CoreTMi3-4170CPU和3.4 GB内存的计算机,在Windows XP和Matlab2012a环境下进行仿真实验。

为了验证混合特征对于不同雾气浓度的线性可分性,对比使用了线性SVM分类器和非线性SVM分类器。其中,非线性SVM分类器的核函数分别使用了:1) 多项式型(γ*u′*v+ccoef0)ddeg;2) RBF函数exp(-γ|u-v|2);3) Sigmoid函数tanh(γ*u′*v+ccoef0)。其中,γ=1/k,ddeg=3,ccoef0=0。

实验结果如表1所示。

表1 不同SVM分类器实验结果

由表1可见,线性SVM分类器分类结果正确率最高,因此选取线性SVM分类器作为雾天图像分类的分类器。

改变权重系数可以改变不同特征在分类器中影响能力的大小,因此经过大量的实验优化了权重系数搭配。219幅测试图片中人工标记结果为无雾54幅,轻雾151幅,浓雾14幅,实验结果如表2所示。

表2 不同特征权值实验结果

由表2可见,单独使用1种特征或2种特征得到的分类正确率小于使用3种特征组合的混合特征得到的分类正确率,并且通过调整各个特征的权重系数可以得到更优的分类正确率,分类正确率最高可以达到95.89%,并且各类别的分类正确率也均高于其他权重系数时的正确率。

文献[8]中对于雾天图像的识别正确率达到90%,文献[9]中雾天图像的识别正确率为95.6%,但是上述文献只是对图像是否为雾天图像进行判断,不能对图像中雾气浓度进行区分,所以难度和正确率均较本文结果偏低。

最后,对算法各部分运算所用时间进行统计,处理一幅像素大小为1024×768的图像所用时间见表3。

表3 算法各部分运算时间

4 小结

本文提出了一种基于线性SVM和混合特征的雾天图像分类算法,为自适应去雾系统提供参考。首先,采用由暗通道直方图特征、小波变换均值特征及去均值归一化系数特征组合而成的混合特征向量对图像能见距离进行描述;其次,利用特征向量集对SVM分类器进行训练;最后,利用训练好的SVM分类器对图像进行分类,并调整各个特征的权重系数对分类器进行优化。

实验结果证明,本算法能够有效区分无雾、轻雾、浓雾的图像,同人工主观分类结果对比,分类正确率达到95.89%。下阶段的工作是扩大图像集,对类别进一步细化,使算法能够更准确地分辨更多等级的雾气浓度,为自适应去雾系统提供更精确的参考依据,并对算法计算量进行优化,减少运算时间,以满足对视频图像实时处理的要求。

[1] 王燕,伍博,谷金宏.一种单幅图像去雾方法[J].电光与控制,2011,18(4):65-67,92.

[2] 陈剑鹏,毕笃彦,熊磊,等.基于双重域的图像去雾新算法[J].电光与控制,2015,22(6):17-20.

[3] 李大鹏,禹晶,肖创柏.图像去雾的无参考客观质量评测方法[J].中国图象图形学报,2011,16(9):1753-1757.

[4] 郭璠,蔡自兴.图像去雾算法清晰化效果客观评价方法[J].自动化学报,2012,38(9):1410-1419.

[5] 南栋,毕笃彦,马时平,等.基于分类学习的去雾后图像质量评价算法[J].自动化学报,2016,42(2):270-278.

[6] 李从利,陆文骏,石永昌,等.基于码书的雾天图像质量评价方法研究[J].图学学报,2014,35(6):876-882.

[7] 李骞,范茵,张璟,等.基于室外图像的天气现象识别方法[J].计算机应用,2011,31(6):1624-1627.

[8] 孟凡军,李天伟,徐冠雷,等.基于K均值聚类算法的雾天识别方法研究[J].现代电子技术,2015,38(22):80-83.

[9] YU X L,XIAO C B,DENG M K,et al.A classification algorithm to distinguish image as haze or non-haze[C]//The 6th International Conference on Image and Graphics, IEEE,2011:286-289.

[10] HE K M,SUN J,TANG X O.Single image haze removal using dark channel prior[C]//IEEE Conference on Com-puter Vision and Pattern Recognition,2009:1956-1963.

[11] MALLT S A.Theory for multi-resolution signal decomposition:the wavelet representation [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1989,7(11):674-693.

[12] 孙洪飞.基于小波变换的图像特征提取方法研究[D].南京:南京邮电大学,2012.

[13] MITTAL A,MOORTHY A K,BOVIK A C.No-reference image quality assessment in the spatial domain[J].IEEE Transactions on Image Processing,2012,21(12):4695-4708.

[14] 李俊峰.基于RGB色彩空间自然场景统计的无参考图像质量评价[J].自动化学报,2015,41(9):1601-1615.

[15] 姜斌,和湘,孙月光,等.一种改进的支持向量机模式分类方法[J].电光与控制,2007,14(4):23-26.

猜你喜欢
雾天特征向量分类器
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
为什么在雾天不适宜进行晨练
微波辐射计对昆明雾天的监测及应用
一类特殊矩阵特征向量的求法
BP-GA光照分类器在车道线识别中的应用
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
雾天高速公路交通安全风险评估