基于视频识别系统的摄像装置

2020-07-09 08:30宋昕一杜正洋董佳

现代信息科技 2020年23期

宋昕一杜正洋董佳

摘要：受疫情影响，各高校的教学工作均以线上“云课堂”的形式开展，但现有摄像头捕捉内容时控制迟缓，导致学生在课堂学习时效率低下。摄像装置功能的改善问题亟待解决。随着视频识别技术的广泛发展与应用，现将此技术应用在摄像头处，实现摄像头高精度的自动跟随捕捉拍摄，提高课堂教学质量。项目一方面可运用于高校课堂的云教学，另一方面也可运用于公司的演讲，远距离视频汇报或教辅机构的教学，用途广泛且便捷高效。

关键词：摄像头;视频识别;人工智能;边缘计算

中图分类号：TP391.41 文献标识码：A 文章编号：2096-4706（2020）23-0028-03

Camera Device Based on Video Recognition System

SONG Xinyi，DU Zhengyang，DONG Jia

（University of Shanghai for Science and Technology，Shanghai 200093）

Abstract：Affected by the epidemic，the teaching work in colleges is carried out in the form of online “cloud classroom”，but the control of the existing cameras to capture the content is slow，resulting in the low efficiency of students in classroom learning. It is urgent to solve the problem of improving the function of camera device. With the wide development and application of video recognition technology，this technology is now applied to the camera to realize the high-precision automatic follow capture of the camera and improve the quality of classroom teaching. On the one hand，the project can be used in cloud teaching in college classroom，on the other hand，it can also be used in the companys speech，long-distance video reporting or teaching in teaching auxiliary institutions，which is widely used，convenient and efficient.

Keywords：camera;video recognition;artificial intelligence;edge computing

0 引言

基于摄像头的相关设计是一个涉及范围很广的课题，尤其是近年来随着技术的不断发展，摄像头识别的相关技术研究逐渐增多。在去年的线上教学过程中，我校主要通过摄像头向学生传送课堂信息。但实际上，课堂摄像头只能较为粗略地捕捉显示画面，存在延迟的情况，导致课堂信息未能及时准确地传送至学生端。在了解了摄像装置存在的一些问题后，作者进行了相关研究，并在学校多位教师的指导下，拟设计出一款基于视频识别系统的多功能摄像装置。系统可控制摄像头自动缩放、移动等相关功能，智能捕捉教师的运动轨迹，进而达到提高教学质量与学习效率的目的;此外，该系统还可针对拍摄内容在微信小程序上实现录播的功能。大大提升了课堂的教学效率。

1 研究现状

针对特定的数据信息进行相应的筛选识别技术已经广泛应用于各个领域。目前大多为利用虹膜与指纹的特定性进行识别，但两者存在的不足之处有成本高昂、可复制性高，不适合大范圍应用，随着相关技术的发展，视频识别技术浮出水面，视频识别简单来说就是根据研究对象的某些特征，对其进行识别并分类。通过将视频划分为一帧帧的图像，从中提取大量的数据，利用训练的算法，将所提取的数据与要匹配的人的信息进行比对，若匹配值达到一定数值，则代表识别成功。视频识别技术的研究意义在于：充分利用现有的技术与先进设备代替人工识别，在提高识别精度与效率的同时还可以大大节约成本。随着实践活动范围的扩大和科学技术水平的提高，我们还可以实现通过人物的任意部位进行特定识别。

2 项目设计方案

2.1 视频识别系统设计方案

对于视频系统设计方案如图1所示，将其分为上课前与上课中两部分，运用两个摄像头，1号摄像头用来确定老师所在位置以及黑板边界，2号摄像头则负责录制工作。上课前先调适好摄像头，之后通过1号摄像头确定黑板边界，从而确定2号摄像头的拍摄范围以及焦距大小，然后准备进入上课中的模式。进入上课中模式后，通过1号摄像头来捕捉与确定老师的位置，从而确保老师始终在2号摄像头镜头范围之内。而当1号摄像头识别到老师走出黑板范围以外时，则控制2号摄像头调整焦距与进行相应转动，保证画面能够实时拍摄到老师与黑板。通过这个识别系统可以确保摄像头既不会跟丢老师，又能使同学们可以看到黑板上的内容。

2.2 机械结构设计方案

系统的机械结构以一体化为目标，在测试阶段为了便于寻找最优角度，要求结构灵活，在摄像过程中使摄像头可自动捕捉面板范围，锁定拍摄内容，使面板内容的呈现可以根据教师的讲解内容而变化。基于此设计了以下两种机械结构方案。

方案一：球形摄像头——球形摄像头采用圆球状造型，一般安装在墙壁较高处进行摄像，其机械结构如图2所示。

该摄像头采用球形旋转识别装置来识别拍摄对象，缩小了摄像头旋转识别的范围，但是此装置需固定在墙面上，不便于拆取移动，另外安装所涉及的零件较多，经济性略差，使得装置很难得到大范围应用。此外。该装置需设计得相对小巧，相应零件选取较复杂，内部开发板、舵机等零件不易选取设计，控制复杂。

方案二：双摄像头三脚架摄像平台——主要由捕捉摄像头、拍摄摄像头、支架和箱体组成，支架包括立柱、三腳支架两部分，如图3所示。

该摄像平台对目前市场上已存在的摄像头的机械结构进行了改进和创新，摄像头箱体和立柱的连接部分为非对称镂空结构，采用阻尼转轴进行连接，减轻了系统整体重量并且便于安装;摄像头箱体可以进行180°旋转，方便实时调节视角，增强摄影效果。三脚架设计为中空可伸缩机构模式;通过滑轨，立柱可以进行调节并固定在任意高度;摄像头箱体能够跟随立柱上下移动或自身进行90°旋转，便于锁定各位置的面板内容。

该装置结构设计简单，可由3D打印完成，经济性较好;整体装置小巧轻便，便于移动操作，适合在学校各教学室移动使用;摄像平台的立柱可调，可以满足不同教室面板高度的差异变化，提高了拍摄效果;适合大批量生产和推广。

综合以上情况，选用方案二作为多功能摄像头平台的机械结构。

3 项目技术关键

3.1 目标检测技术

目标检测技术在本项目中用于检测老师所在的位置。目标检测技术本质上是先将视频分成帧图像，依次识别每张图像，然后再将图像合成视频。该项目中识别教师的问题可以通过滑动窗口的办法来解决。在扫描较大图像的较小区域，可以通过滑动窗口的方式解决定位问题，进而实现在同一图像的不同尺度下重复扫描。而对于滑动窗口带来的区域重叠问题可以用“支持向量机（SVM）”来解决。

3.2 边缘检测技术

该项目需要通过边缘检测技术来检测黑板，边缘检测技术主要是利用导数、微分计算亮度的变化，针对图像边界变化明显的点来进行标识检测。在实际中存在诸多干扰因素导致检测率低，主要包括噪声、镜面反射、聚焦模糊等干扰因素，造成无法判定相邻点梯度变化值的边界阈值。本项目主要通过滤波抑躁以及相应锐化的方式来提高检测精度。

4 模型选取

4.1 Harr特征

Haar特征分为四类：边缘特征、线性特征、中心特征和对角线特征，共同组合成特征模板。特征模板内有白色和黑色两种矩形，并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和的差值。Haar特征值反映了图像的灰度变化情况。在确定了特征形式后Harr-like特征的数量就取决于训练样本图像矩阵的大小，特征模板可以置于子窗口内的任意放置，一种形态称为一种特征，找出所有子窗口的特征是进行弱分类训练的基础。

4.2 级联分类器

级联分类器的功能包括获得特征类型getFeatureType，计算有序或无序特征等操作。由于Harr特征数量过多，几乎已经超过任何一种机器学习算法的输入特征数量极限（2001年），因此直接训练一个分类器是不现实的，本项目级联分类器的策略是，将若干个强分类器由简单到复杂排列，希望经过训练使每个强分类器都有较高检测率，而误识率可以降低。于是项目使用多个弱分类器组成一个强分类器的方法进行训练。在本系统中，每一个弱分类器只针对一个单独的特征：

hj（x）=

其中，hj为级联分类器的特征;x为分类器的属性;fj为分类器的检测率;θj为分类器标准检测率。

该级联分类器使用AdaBoost方法进行训练，训练分类器的同时也筛选特征，最终分类器的级数与使用的特征数量相同（每个分类器只使用一个特征）。最终的分类器为：

hj（x）=

T为级联分类器的数量，同时也是选择特征的数量，为了减少计算量，在计算Harr特征时，级联分类器未使用的特征可以不纳入计算范围;at为单个分类器的权重，在训练过程中得到;t为使用分类器的标号，进行区分;ht为分类器的级数。

OpenCV自带了一些级联分类器，可以用于识别人脸，五官和人体等等，在Python下的使用方法为：

face_cascade=cv2.CascadeClassifier（“./haarcascades/haarcascade_frontalface_alt2.xml”

faces=face_cascade.detectMultiScale（gray， scaleFactor=1.3， minNeighbors=2，

minSize=（60，60）， maxSize=（300，300））

首先调用cv2.CascadeClassifier（），打开一个级联分类器，这里载入的xml为OpenCV自带的人脸识别级联分类器，随后调用.detectMultiScale（）方法进行识别，参数含义为：

（1）第一个参数image：待识别图片必须是灰度图片。

（2）第二个参数scaleFactor：被检测对象的尺度变化，合理范围为1.1～1.4，该参数越大检测越细致，速度越慢。

（3）第三参数minNeighbors：每个候选框需要保留多少个领域，该参数越大，一个候选框越难被接受。

（4）第四个和第五个参数minSize和maxSize：目标的最小尺寸和最大尺寸，当目标超过这一范围时无法识别。

该函数返回一个list，其中每个元素为一个有4个元素的list，分别是[x，y，w，h]，可直接用于绘制矩形框。训练级联分类器选择FDDB数据集训练针对人脸的级联分类器。

5 结论

本项目主要通过OpenCV自带的Harr和级联分类器实现人脸检测进而完成视频识别，在实际搭建完毕的测试中，摄像头基本可以实现自动跟踪捕捉人物的移动轨迹，从而进行一系列的移动操作，在一定程度上大大提高了课堂的效率性。但摄像平台后期在微信小程序中的录播回放功能，因涉及到各个模块的交互，开发周期较长，目前仍在完善中。

参考文献：

[1] 施巍松，刘芳，孙辉等.边缘计算 [M].北京：科学出版社，2018：1-3.

[2] 熊凯龙，范方亮，汪保玉，等.基于一种新的级联分类器的目标检测系统 [J].现代电子技术，2020，43（1）：48-52.

[3] 马原野，韦莎，史扬，等.边缘计算及其标准化工作探索 [J].信息技术与标准化，2017（9）：29-32.

[4] 夏国淼.基于HLA的多嵌入式人脸识别系统的研究与实现 [D].南昌：江西师范大学.

[5]朱红高.图像边缘检测技术研究现状 [J].制造业自动化，2010，32（1）：45-47.

[6] 赵志成.人脸检测与识别算法研究及Android平台实现 [D].西安：西安电子科技大学，2014.

作者简介：宋昕（2000—），女，汉族，山西忻州人，本科在读，研究方向：电气工程及其自动化;杜正洋（2000—），男，汉族，上海人，本科在读，研究方向：电气工程及其自动化;董佳（2000—），女，汉族，黑龙江牡丹江人，本科在读，研究方向：电气工程及其自动化。