广电视频图像人物识别技术与算法

2019-06-11 03:10花逢春
科技创新导报 2019年6期
关键词:图像识别算法

花逢春

摘   要:现代社会是信息化社会,广电产业经过多年的发展已经逐步建成了以有线电视网络为核心的广电网络,将有线、无线和卫星通信三大行业交叉联合构建了新的数字化的体系,形成了以广电网络为核心的综合性多媒体信息平台。广电网络所具有的开放性、交融性也对广电网络的运行管理带来了极大的挑战。巨大的信息量需要投入更多的精力用以规范图片、文字等的内容,通过构建以计算机图形工作站为核心的监控体系,加强图像识别技术的研究与应用,进一步提升图像的识别与管控效率。

关键词:计算机图形工作站  图像识别  算法

中图分类号:T391.41                               文献标识码:A                        文章编号:1674-098X(2019)02(c)-0138-03

视频图像特征分析与管理难度大、任务重,传统的视频监管主要采用人工审核的方式,利用人工建立的数据库及各种视频属性来进行查询管理。传统方式任务重、效率慢无法适应当今需求。图像识别技术的发展与应用将有助于提高对于图像监管的效率与效果。本文在分析图像识别关键特征的基础上对图像识别技术的算法进行了分析介绍。

1  人物视频图像识别关键特征的识别与提取

1.1 人物图像肤色特征识别

计算机所呈现出的视频图像是由众多的像素点所组成的,图像识别中关于像素颜色的识别需要借助于色度理论学.根据色度理论学原理任何颜色都可由红、绿、蓝三基色按照一定的比例所混合而成。对于色度的表示常用的颜色空间主要有以下几种:RGB(红、绿、蓝)、HIS(色度、饱和度、亮度)和YUV(亮度、色差)。人物图像肤色识别特征主要是找出人体表层和人体真皮层所形成的不同反射光。其中,图像中的人物肤色会由于表皮层黑色素含量的不同而呈现出一定的差异,其中人体表皮层的反射光起决定性因素。在图像人物肤色检测中并未有最优的颜色空间,不同的颜色空间对应着不同的检测算法且各有优异。

1.2 图像人物轮廓、形状等纹理特征

在图像识别中,图像轮廓、形状等纹理特征能够有效地实现人物图像的识别。其中,基于小波变换的边缘检测技术在图像人物识别中能够取得良好的识别效果,借助于小波变换技术能够在图像人物肤色特征的基础上更好地识别图像。小波变换图样检测能够融合泛函分析、数值分析、样条分析以及调和分析的特点完成对于图像的小波分析用以更好的检测图像在轮廓、形状等的纹理特征。

1.3 图像人物皮肤形态过滤

在人物图像识别中人物皮肤的几何形状信息也可作为人物识别的重要特征之一。在图像识别技术中对于皮肤形态识别的一般算法主要采用的是先得到皮肤区域而后利用人物图像的几何形态对人物的四肢及躯干等部分进行识别.在这一过程中受人物完整度与噪声等因素的影响致使一般图像人物识别算法未能发挥出较为良好的识别效果。在图像识别技术中需要应用分形维计算法就图像人物皮肤以零散破碎的几何形状进行计算描述,并将其作为图像识别的重要特征。

1.4 以Kohonen神经网络为基础进行图像样本选取

传统的广电图像识别管理模式数据处理量大且复杂,为提高图像识别处理速度可以利用Kohonen神经网络完成对于图像数据的矢量化压缩,通过对所需处理的图像数据采取样本提取和与分类的方式将能够大幅降低图像识别所需处理的数据量。Kohonen神经网络具有自动聚类识别环境的特性,属于自组织竞争型神经网络。以Kohonen神经网络为基础所编制的图像人物识别算法能够在图像人物识别处理中通过对图像人物样本植与各神经元权植进行对比并找出距离最小的神经,并通过调整其与邻近神经元的权值获取所需要的信息,完成图像人物识别。

1.5 图像人物识别前馈神经网络

利用Kohonen神经网络对所需处理的图像数据进行筛选压缩后,将极大地降低图形人物处理的数据量,在这之后利用前馈神经网络进行识别训练将能够有效地提升图像人物识别的效率,利用前馈神经网络进行图像人物识别是一种极为有效的图像特征识别方法。应用于图像人物识别的前馈神经网络主要由输入层、输出层、隐含层神经元以及各层之间的互联部分所组成,在进行图像人物识别时通过对所输入的信号进行跟踪识别,将输入信号在各神经元之间相互传,利用神经网络完成对于图像人物特征的正向传播学习,并根据正向传播学习过程中所產生的误差来修正偏差,通过多次的调整校正将图像人物识别输入信号的误差降至最低。前馈神经网络的应用将原先的一组一种输入到一种输出的模式转变为一组输出模式,通过前期的调整校正训练将能够完成前馈神经网络输出模式的系统变换。前馈神经网络算法能够在图像人物识别得到良好的应用,其核心在于将图像人物识别转化为输入信号的正向传播与识别信号误差的反向传播两大不同的环节。在图像人物信号的正向传播识别中网络的权值保持稳定,前馈神经网络算法进行图像人物识别中对于输入信号仅仅在不同层级神经元之间单向传递,而当前馈神经网络算法的输出层的输出结果与预期偏差较大时则前馈神经网络算法将把误差转入反向传播。反向传播时在输出端反向传播未达预期的正向传播的信号误差值,反向传播信号在前馈神经网络算法中将进入到输入层,并根据误差信号动态调整前馈神经网络算法中的各神经元层的连接权植,如此多次的正反向传播调整校正将调整前馈神经网络算法使其能够满足图像人物识别所需满足的精度。三层前馈神经网络算法的结构模型图如图1所示。

2  广电图像识别监管系统

广电图像识别监管系统其主要用于对广电播送的内容进行实时监控,通过图像识别将所播放内容中不合格的部分筛选并按照相关规定进行处理。图像人物识别关键是获取视频关键帧图像,根据所筛选的图像由广电图像识别监管系统所判断并采取相应的处理措施。

2.1 图像人物识别预处理

对于需要进行图像人物识别的视频资料,首先需要对视频资料进行降噪处理,用以减少外界干扰在数字图像数字化及传输过程中所产生的干扰噪声,提高图像人物识别的效率与效果。在完成降噪处理后对于所需要图像人物识别的图像进行场景增强,筛选并强化图像中的关键特征信息,弱化图像中的无关信息以使得处理后的图像能够获得图像视觉效果的强化。对于完成场景分析的图像将根据需要进行区域划分,将图像划分为若干有意义区域或部分处理图像。图像人物识别预处理通过降噪-场景分析-图像处理-图像分割-目标提取等将待处理视频图像中的目标图像提取出来以待后续图像人物识别操作。

2.2 人物图像识别流程

完成图像人物预处理后需要完成图像人物识别操作。图像人物识别过程中首先应根据图像人物识别算法演算所生成的模式向量来对比对应的特征函数,并将图像信号作为输入信号输入到所选定的特征参数中以此来计算图像所具有的特征值,从而将图像所具有的底层视觉信息转化为语义信息便于后期查詢处理。

2.3 图像人物识别的主要算法设计

为实现图像人物识别需要多个算法相组合,其中包含有基于HIS颜色空间和R值的人体肤色检测算法、小波降噪和多分辨率压缩算法、分形维数形态过滤算法、Kohonen神经网络算法等多个算法。

2.3.1 基于HIS颜色空间和R值的图像人物肤色识别算法

为实现图像人物肤色识别其关键在于以预先设定的阀值为基准对比提取肤色的像素点,以此完成对于图像人物肤色的选取。据研究人员表明,红、绿、蓝三基色中红色在数字图像中占据着较大的数值,在一般光照下人物图像中红色数值在200±20的区间范围内,而剩下的绿、蓝原色则多在100以内。而在非一般光照下红、绿、蓝三原色的值范围则会有所扩大,在高光条件下三原色中的红色数值最大可以达到250及以上,而在低光条件下三原色中的绿、蓝两色数值最低可低于50,因此在图像人物肤色检测中仅靠所设定的阀值较难完成对于图像人物的肤色选取,而在图像人物肤色识别中选用H空间算法则不受亮度、对比度的变化而影响,是一种较为稳定的肤色提取方法。在图像人物肤色识别算法中将主要利用HIS颜色空间中的分割阙值的方法来计算图像人物中的肤色区域,由于人体肤色主要分为黄、白、黑、棕、红,且各肤色之间差别较大,黄白色的皮肤肤色亮度较高,且SI对图像人物肤色分割影响较大,在颜色空间的选择上需要综合考虑H、S、I、R四个方面以此来确定图像中的人物提取区域。基于图像人物肤色的初步提取主要利用像素点颜色特征来提取,为规避杂色像素点所带来的影响,需要对人物图像进行消噪处理,利用中值滤波法将能够有效的消除杂色点所带来的影响。中值滤波法其原理是利用一个含奇数个点的滑动窗口利用灰度排序法对滑动窗口内的像素进行排序,并使用滑动窗口内的中心像素的灰度值替代为中值。通过HIS颜色空间的处理数字可以将图像人物中的非肤色区域进行良好的处理,利用工作站处理后的数字图像非肤色区域经过检测后尽管还含有一些错处理区域但是大部分的人物肤色区域还是得到了正确的定位标识,针对过滤处理后所含有的一些错标识区域可以利用皮肤纹理过滤技术进行再次筛选过滤,以此得到所需要的图像人物肤色区域信息特征。

2.3.2 小波多分辨率压缩算法

小波多分辨率压缩算法其核心在于将输入的原始图像经过三层分割过滤,将原始图像划分为低频部分和高频部分,并将所过滤出的低频部分按照上述方法再次进行高、低频部分的过滤。经过小波多分辨率压缩算法过滤后的原始图像其低频图像保持了原始图像的主要轮廓,将原始图像中的人物轮廓大致的表现了出来。而分解出的高频图则将原始图像中的各个细节表现了出来。小波多分辨率压缩算法能够将图像各个方向上的轮廓信息分解出来,经过小波多分辨率压缩算法处理后的图像将能够获得到图像人物轮廓的二值图,在得到人物轮廓的二值图后将能够为下一步敏感部位的定位带来方便。

2.3.3 分形维数形态过滤算法

在完成了小波多分辨率压缩算法处理后的图像将需要使用分形维数形态过滤算法进行后续处理,图像经过了颜色和纹理过滤后使用分形维数形态过滤算法将能够有效的将图像中杂物所引起的误差剔除出去,讲过上述处理后的图像将在通过腐蚀、膨胀等处理后所形成的四联通候选肤色块中筛选掉区块较小的肤色块,并统计计算剩余区域中肤色块的分形维数。分形维数形态过滤算法应用中需要经过多次对比并选用合理的分形维数阙值用以过滤误差,以确保图像人物识别取得良好的识别效果。分形维数阙值在1.15和1.23时将能有效的将图像中的人物与背景中的沙滩、植物等进行有效的区分。

2.3.4 Kohonen神经网络算法和前馈神经网络算法

对于图像文件经过上述算法的处理后将从原始图像文件中提取出32*32像素的24位像素块,各像素块所占据的字节数为32*32*3=3072字节,这一数值要远远高于一般三层前馈神经网络的处理能力,为满足一般三层前馈神经网络算法的处理需求,需要将原始的32*32图像块分解为16份的8*8图像块来作为前馈神经网络算法的输入数据,通过上述划分将32*32*3的字节划分为16个8*8*3=192字节的图像块,192字节能够满足前馈神经网络算法的128-256字节的处理能力。Kohonen神经网络算法利用上述16个192字节的图像块来作为训练样本进行训练,Kohonen神经网络算法对上述训练样本完成训练后将能够得到一组代表聚类信息的权值矢量,权植矢量都为192字节并借助于Kohonen神经网络的识别功能与所训练的样本权植进行逐一对比并归类,通过Kohonen神经网络算法能够将8*8的矢量块转化为能够识别的十进制编号,从而将原始的32*32图像块转变为16个十进制数元素组成的新矢量而一个字节的十进制数可以表示256类聚类,通过上述划分将能够有效的解决数据量多且难以处理的难题。前馈神经网络算法是一种非线性优化算法,针对前馈神经网络算法应用过程中所出现的局部极小问题所带来的算法不收敛问题需要在前期选择合适的初始权值和阙值,以此来规避陷入局部极小点的问题。前馈神经网络算法的收敛速度较慢,为提高图像人物的识别效果,在应用前馈神经网络算法时需要选择好收敛阐述α。为提高图像人物识别的可靠性与准确性需要加强对于前馈神经网络算法的训练, 前馈神经网络算法的训练需要多种样本。

前馈神经网络算法的实现需要按照以下步骤进行:(1)首先就各层的权值Wij进行初始化,使得Wij变成一个较小的非零随机变量。(2)选取输入样本X0和期望输出Y0并计算出实际输出Y1与期望输出Y0之间的误差。根据预设的误差取值E判断实际输出误差是否满足使用要求,如果实际误差值在预设误差E的范围内则可以将实际输出误差作为一个样本进行输出。在对前馈神经网络算法训练时要求所有的样本输出误差值都在预设误差E的范围内。如输出误差超限且训练次数未达到阙值M,则执行下列部分:

3  结语

图像人物识别是广电系统监管中的重点及难点。本文在分析图像人物识别技术难点的基础上就如何基于图形工作站开发应用图像人物识别技术进行了分析阐述。

参考文献

[1] 施琦,王涌天.一种基于视沉的增强现实三维注册算法[J].中国图象图形学报:A辑,2002(7):679-683.

[2] 黄静涛.档案仿真复制中进行图像处理的几点体会[J].中国档案,2011(11):60-62.

[3] 杨为民.漫谈PC图形工作站[J].计算机辅助设计与制造,2002(5):79-80.

猜你喜欢
图像识别算法
基于MapReduce的改进Eclat算法
基于Resnet-50的猫狗图像识别
Travellng thg World Full—time for Rree
高速公路图像识别技术应用探讨
进位加法的两种算法
图像识别在物联网上的应用
图像识别在水质检测中的应用
浅谈模式识别在图像识别中的应用
基于增强随机搜索的OECI-ELM算法
一种改进的整周模糊度去相关算法