基于稀疏子空间聚类的主动学习算法

2021-01-06 08:57姜秀波钟丽媛宋曹根

计算技术与自动化 2021年4期

姜秀波钟丽媛宋曹根

摘要：针对现有海量数字图像信息落后，提出了新型的压缩算法，设计出基于FPGA的视频图像采集系统。应用深度卷积神经网络优化视频图像编码算法和聚类算法实现数据特征提取，将图像与距离信息作为深度卷积神经网络的输入与输出，并利用其特征提取能力学习图像特征的距离信息，提取深度卷积神经网络中的全连接层作为编码，通过迭代调整确定图像编码，完成图像压缩。应用测试结果显示，该算法具有较高效率优势，且图像压缩解码后质量较好。

关键词：FPGA;深度卷积神经网络;优化压缩;图像采集;编码加速器

中图分类号：TP37 文献标识码：A

大数据与信息化时代的到来使数字图像等多媒体形式的信息量暴增[1]，海量数字图像信息给带宽存储等方面带来巨大压力[2]，对数字图像信息的优化压缩提出更高要求，因此数字图像的优化压缩算法成为海量数据应用领域中的研究热点[3]。

图像编码是图像压缩的一种主要方式[4]，在满足信噪比等图像质量要求的基础上，利用图像编码技术可通过较少比特数描述数字图像及其中涵盖的信息[5]。当前普遍使用的图像编码算法主要采用预测—变换—熵编码的方式完成[6，7]，利用繁复的变换机制提升图像压缩质量的同时也提升了图像编码算法实现的复杂度[8]。

为改善这一问题，在图像编码过程中引入典型深度学习框架—深度卷积神经网络[9]，利用其学习聚类算法获取的图像特征距离信息，基于数字图像特性在迭代过程中调整聚类结果提升图像编码的有效性。同时考虑深度卷积神经网络执行过程中计算效率较差无法满足图像编码实时性需求的缺陷，提出基于FPGA的深度卷积神经网络优化压缩算法。作为数字电路设计模式，FPGA的并行计算特征可弥补深度卷积神经网络效率差的缺陷[10]，并利用加速器设计提升效率，优化深度卷积神经网络编码算法。

1 基于FPGA的深度卷积神经网络优化压

缩算法

1.1 基于FPGA的视频图像采集系统

图1所示为基于FPGA的视频图像采集系统整体结构框图，其中主要包含采集、存储、处理、显示等模块[11]。为有效管理、控制各模块，FPGA在具有并行数据处理特性的基础上，还需要包含大量I/O口与逻辑单元等。选取具有低功耗特性的EP4CE617C8型号FPGA，其中I/O口、逻辑单元与乘法器数量分别为190个、63903个和403个。

FPGA利用集成电路总线接口连接视频图像传感器，控制其拍摄视频图像。采集模块采集视频图像信息后经由FIFO缓存器实施存储，再经由FIFO缓存器读出并传输至处理模块中进行优化压缩处理[12]，处理后的视频图像信息通过VGA接口呈现在显示器上。设ARM处理器是深度卷积神经网络加速器的主控制器[24]，其利用片內总线连接PL区域的控制器，PL区域的控制器与片上数据存储器相连，

1.2 视频图像编码算法

图像编码是当前普遍使用的一种图像压缩算法，处理模块中采用基于深度卷积神经网络的视频图像编码算法完成视频图像压缩处理。

基于深度卷积神经网络的视频图像编码算法通过预训练模型采集视频图像特征[13]，选取K均值算法计算不同视频图像间特征的距离信息，基于相同来源的视频图像属一类的原则调整视频图像特征的距离信息[14，15]，由此获取视频图像聚类标签zi。利用深度卷积神经网络学习距离信息[16]，多次迭代，依照自编码位数实际要求，实施图像稀疏自编码。图2所示为深度卷积神经网络距离信息学习与编码生成过程。

表1所示为图2中深度卷积神经网络结构，整体共18层，卷积层3-x和全连接层y中的3、x和y分别为卷积核大小，特征图数量和神经元数量。

（4）循环上述过程至迭代次数达到设定上限，选取降噪自动编码器，将最终得到的特征编码为制定的编码长度，实施稀疏自编码。

通过上述过程即可获取优质的图像编码效果，实现图像压缩。

1.3 基于FPGA的加速模块设计

在基于FPGA的视频图像采集系统中，处理模块利用深度卷积神经网络编码算法进行图像压缩，FPGA的并行化计算模式与之相结合，可弥补深度卷积神经网络效率差的缺陷。同时在处理模块中设计深度卷积神经网络加速器，使图像压缩整体过程中仅加载一次输入图像与卷积核权值[23]，并存储于片上存储器内，降低片外存储器读取次数，优化图像压缩效率。最终优化加速模块如图3所示。

如图3所示，可将输入图像传输至各卷积模块内，各卷积模块均包含存储权值的系数存储器，利用输入图像和权值实施卷积运算获取输出结果。在加速模块优化设计过程中，可满足任意类型卷积操作的需求[25]，不同卷积操作的输入图像尺寸、卷积核大小与数量等采数均有所不同，所以PL区域的控制器主要负责配置深度卷积神经网络编码算法计算过程中的参数，并确定对应地址。

2 应用测试

为验证所提算法的性能，在美国洛杉矶大学数字图像实验数据库中随机选取1幅1024×1024×16bit标准数字图像作为研究对象，在设定实验环境下采用本文算法对其进行优化压缩实验，将本文算法（研究对象1）研究结果语言与文献[7]（研究对象2）和文献[8]（研究对象3）方法进行对比测试。表2所示为实验环境。

2.1 应用时间测试

在设定实验环境中，采用本文算法进行研究对象压缩与解码对比测试，所需时间如表3所示。

分析表3得到，采用本文算法对研究对象实施压缩过程中，各研究对象在相同码率条件下压缩所需时间基本一致。随着码率由0.075提升至0.6，压缩过程所需时间也呈现上升趋势，由0.075码率时的0.53 s（三幅研究对象压缩时间均值，以下类推）上升至0.6码率时的1.41 s。同样的，研究对象解码过程所需时间也随着码率提升而提升，且相同码率条件下所需时间基本一致。对比本文算法实验结果与文献[7]和文献[8]中两种对比算法的实验结果得到，本文算法对研究对象实施压缩与解码所需时间显著降低，由此可知本文算法能够在有效压缩实验对象的基础上，具有显著的效率优势，达到本文算法优化压缩的目的。

2.2 压缩效果测试

图4所示为本文算法压缩解码后得到的研究对象与研究对象2和研究对象3对比效果。

结构相似度指数与峰值信噪比是图像压缩解码效果客观评价的主要评价指标，为客观评价本文算法对研究对象的压缩效果，基于图4中本文算法解码图像，对比本文算法与其他对比算法在不同码率下的峰值信噪比和结构相似度指数，结果如表4所示。

峰值信噪比与结构相似度指数分别描述研究对象最大可能功率与影响其精度的噪声功率间的比值和不同研究对象间结构相似程度，两个指标的值均同研究对象压缩解码后清晰度呈正比例关系，也就是峰值信噪比/结构相似度指数越高，研究对象压缩解码后清晰度越高。由表4得到，在不同码率下本文算法客观评价结果两指标均显著优于对比算法。当码率由0.075提升至0.3时，本文算法客观评价结果提升幅度均较为明显。当码率提升至0.6时，评价结果提升幅度达到极小状态。结合上一实验表3中本文算法压缩解码过程所需时间得到，码率由0.3提升至0.6条件下，本文算法压缩解码时间与研究对象压缩解码效果失衡，由此得到，采用本文算法进行研究对象优化压缩时，最佳码率约为0.3。

3 结论

提出基于FPGA的深度卷积神经网络优化压缩算法，将深度卷积神经网络应用于数字图像压缩中，利用FPGA优化深度神经网络学习过程，实际应用测试结果验证了本算法应用性能的优越性，采用本算法进行研究对象优化压缩时，能够在有效压缩实验对象的基础上，具有显著的效率优势，且最佳码率约为0.3。在后續研究中可尝试从其他方面优化本文算法的压缩性能。

参考文献

[1] 高俊岭，陈志飞，章佩佩. 基于FPGA的实时视频图像采集处理系统设计[J]. 电子技术应用， 2018， 44（2）：10-12，19.

[2] JOSCHA M ， STEFAN S ， MICHAEL K ， et al. Deep scatter estimation （DSE）： accurate real-time scatter estimation for X-Ray CT using a deep convolutional neural network[J]. Journal of Nondestructive Evaluation， 2018， 37（3）：57-59.

[3] 白琮，黄玲，陈佳楠，等. 面向大规模图像分类的深度卷积神经网络优化[J]. 软件学报， 2018， 29（4）：137-146.

[4] 周晓波，何魁华，周聪. 基于FPGA的图像高速去雾实时系统设计实现[J]. 电视技术， 2018， 42（4）：67-72.

[5] 翁天阳，庄宇，于玮，等. 基于HPS和FPGA的图像压缩感知编解码系统[J]. 电子技术应用， 2017， 43（5）：90-93.

[6] 张格森，陈东生，邱海韬，等. 基于FPGA的高速图像跟踪系统设计[J]. 微电子学与计算机， 2017， 34（4）：13-16.

[7] 张秀，周巍，段哲民，等. 基于卷积稀疏自编码的图像超分辨率重建[J]. 红外与激光工程， 2019， 48（1）：324-330.

[8] 王金平. 基于深度卷积稀疏自编码分层网络的人脸识别技术[J]. 太原理工大学学报， 2018， 49（5）：765-770.

[9] NGUYEN T，BUI V，NEHMETALLAH G. Computational optical tomography using 3-D deep convolutional neural networks[J]. Optical engineering， 2018， 57（4）：43111.1-43111.11.

[10]范斌，于起峰. 一种基于FPGA的图像自动增强算法与实现[J]. 空间科学学报， 2018， 38（2）：261-270.

[11]李申，严伟，夏珺，等. 基于FPGA的HEVC感兴趣区域编码算法研究与设计[J]. 电子技术应用， 2018， 44（7）：52-55.

[12]刘兴旺，王江晴，徐科. 一种融合AutoEncoder与CNN的混合算法用于图像特征提取[J]. 计算机应用研究， 2017， 34（12）：3839-3842.

[13]WU H ， ZHAO J . Deep convolutional neural network model based chemical process fault diagnosis[J]. Computers & Chemical Engineering， 2018， 115（12）：185-197.

[14]戴凤智，魏宝昌，欧阳育星，等. 基于深度学习的视频跟踪研究进展综述[J]. 计算机工程与应用， 2019， 55（10）：16-29.

[15]秦东辉，周辉，赵雄波，等. 基于卷积神经网络图像识别算法的加速实现方法[J]. 航天控制， 2019， 37（1）：22-27.

[16]贾瑞明，刘圣杰，李锦涛，等. 基于编解码双路卷积神经网络的视觉自定位方法[J]. 北京航空航天大学学报， 2019， 45（10）：1965-1972.

[17]SUN Y，XUE B， ZHANG M，et al. Evolving deep convolutional neural networks for image classification[J]. IEEE Transactions on Evolutionary Computation， 2020， 24（2）：394-407.

[18]王杰，张曦煌. 基于图卷积网络和自编码器的半监督网络表示学习模型[J]. 模式识别与人工智能， 2019， 32（4）：317-325.

[19]ASTRID M，LEE S I. Deep compression of convolutional neural networks with low-rank approximation[J]. Etri Journal， 2018， 40（4）：421-434.

[20]YANAGAWA M，NIIOKA H，HATA A， et al. Application of deep learning （3-dimensional convolutional neural network） for the prediction of pathological invasiveness in lung adenocarcinoma： A preliminary study[J]. Medicine， 2019， 98（25）：16119.

[21]ZHANG Z ， ZOHREN S ， ROBERTS S . DeepLOB： deep convolutional neural networks for limit order books[J]. IEEE Transactions on Signal Processing， 2019， 67（11）：3001-3012.

[22]劉芳，王鑫，路丽霞，等. 基于稀疏编码和卷积神经网络的地貌图像分类[J]. 光学学报， 2019， 39（4）：115-123.

[23]朱喆，许少华. 降噪自编码器深度卷积过程神经网络及在时变信号分类中的应用[J]. 计算机应用， 2020， 40（3）：698-703.

[24]高俊岭，陈志飞，章佩佩. 基于FPGA的实时视频图像采集处理系统设计[J]. 电子技术应用， 2018， 44（2）：10-12.

[25]JING J F， MA H， ZHANG H H. Automatic fabric defect detection using a deep convolutional neural network[J]. Coloration Technology， 2019， 135（3）：213-223.

[26]白琮，黄玲，陈佳楠，等. 面向大规模图像分类的深度卷积神经网络优化[J]. 软件学报， 2018， 29（4）：137-146.

计算技术与自动化2021年4期

计算技术与自动化的其它文章: 基于Bézier曲线的碰撞角约束多项式制导方法; 基于FAL函数滤波的动力定位自抗扰控制器设计; 改进天牛须算法对滑翔炸弹控制器的优化设计; 基于RobotStudio的机器人上下料工作站设计与仿真; 基于有载分接开关协调的主动配电网电压控制研究; 基于LabVIEW的通用飞机铅酸蓄电池测试系统设计