探究图像识别教学中的计算思维培养方式

2019-08-13 09:09朱丽花白珍
中国信息技术教育 2019年14期
关键词:图像识别阈值人脸

朱丽花 白珍

随着移动互联网、智能手机和各种社交媒体的发展,图像慢慢成为互联网中的主要信息载体,图像识别在日常生活中扮演了非常重要的角色。例如,交通运输方面的车牌自动识别系统,公共安全方面的指纹识别技术、人脸识别技术,农业方面的食品合格检测技术、森林里树木的健康状况分析技术,医学方面的X光片识别技术,商业方面的扫描二维码、商品相似款搜索技术,生活娱乐方面的“以图搜图”技术、娱乐监管技术等。此外,在机器人、智能家居、自动驾驶、教育、古玩等行业,图像识别也有不同程度的应用。但是,对课标提到的数据与计算的内容,不少教师的理解还停留在数值计算和工具操作层面,很少关注计算机处理类似于图像、视频等非数值型数据的原理和方法,并且普遍存在重实践轻理论、重操作轻思维的倾向。引导学生探究“人脸识别”背后的技术原理,体会形成问题解决方案过程中产生的一系列思维活动,有助于学生计算思维的发展。

● “人脸识别”案例呈现

如今“刷脸”时代已经到来,人脸识别技术已应用到公安、机场、边防、银行、电子商务、单位考勤、安防等多个领域。那么,“人脸识别”是什么?它又是如何工作的呢?人脸识别可描述为给定静止或动态图像,利用已有的人脸数据库来识别图像中的一个或多个人,因此人脸识别通常也叫做人像识别、面部识别等。人脸识别技术的工作过程可以概括为信息数字化、简约、提取关键特征、自动识别等,具体过程如图1所示。

信息数字化。从摄像头、照片或视频中采样,检测出人脸的存在并确定其具体位置。

简约。为了保证人脸图像中人脸大小、位置以及人脸图像质量的一致性,必须对图像进行简约和预处理。常用的操作有增强图像对比度、姿态矫正、光照补偿、尺寸归一化、锐化等。

提取关键特征。提取出人脸中眼睛、鼻子、嘴巴的距离、倾斜度等关键特征。

自动识别。输入一个人脸特征,和数据库中对应的特征进行逐个比对,找出“一个”与输入特征相似度较高的特征。将这个较高相似度值和预设的阈值相比较,如果大于阈值,则返回该特征对应的身份,否则返回“不在库中”。

人臉识别技术使用到的提取、约简、数字化、抽象特征、建立模型、设计算法、自动处理等要素,都是构成计算思维的基本要素。

● 运用计算思维探究“人脸识别”背后的技术

通过界定问题、抽象特征、建立模型、合理组织数据、判断分析与综合等一系列计算思维活动,能够有效探究“人脸识别”背后的技术。

1.界定问题

界定问题是把复杂的问题分解为具有可操作性的若干个小问题。

“人脸识别”的依据是什么?人脸识别是利用图像识别技术,根据原始图像的颜色分布、几何形状、纹理等视觉特征,来搜索相似的图像。它的技术方法有很多种,常用的一种称为“内容特征法”。

计算机中的图像如何存储?计算机中的图像,画面被划分成一个个按行、列顺序排列的“方格”,这些“方格”称为“像素”(如图2)。

2.抽象、提取关键特征

抽象、提取关键特征是从问题出发,排除无关因素,提取研究对象的重要特征,找到解决问题的关键要素。

我们将原图转成一张较小的灰度图像,假定为50×50像素(如图3)。这一步的作用是去除图片的细节,只保留结构、明暗等关键信息,摒弃不同尺寸、比例带来的图像差异。

我们将灰度图像进一步转换成黑白图像(如图4)。转换时,先要为“黑”和“白”设定一个恰当的分界值,称为“阈值”。灰度小于这个阈值的像素被确定为“黑”,灰度大于这个阈值的像素被确定为“白”。阈值确定的原则是使黑白图像的轮廓与原图尽量一致。

3.建模、构造算法

通过关键要素间的逻辑关系,用形式化的方法来处理逻辑演算,构建数学模型,即将各关键要素的逻辑关系式通过一定的符号联系起来,形成表达推理的形式结构。

我们将黑白图像中的每个像素用二进制数0或1表示,0代表黑,1代表白,形成一个50×50的0-1矩阵,称为“特征矩阵”(如图5)。

我们将搜索到图像的特征矩阵与原图的特征矩阵进行比对,比对方法类似于“汉明距离”算法,即对两个矩阵中相同位置的二进制数值进行异或运算,若两个值相同则运算结果为0,否则为1。

4.分析数据,得出结论

统计运算结果中1的个数,若1少于一定数量则认为两张图像相似,否则认为不相似。

由此可知,特征矩阵是根据原始图像的内容决定的。因此,需要对图像进行预处理,如调整色相、饱和度、明度、对比度、清晰度以及裁剪、局部加工等,强化图像的内容结构,突出图像特征,提高搜索效率。

5.迁移、拓展延伸

人脸识别技术可以减少信息泄露,加快通行检查速度,打击犯罪等。跟“人脸识别”使用相似技术原理的有车牌自动识别系统、商品相似款搜索、生物识别、水利资源调查等(如图6),这些都属于图像识别技术。

图像识别技术是立体视觉、运动分析、数据融合等实用技术的基础,是人工智能的一个重要领域,它已经应用于我们生活的方方面面,给我们带来极大便利。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。

在日常教学中,我们应该从最基本的概念、技术出发,刨根问底,追根溯源,让学生理解理论从何而来,向何而去,指导学生运用计算思维进行深入思考,帮助他们在分析问题和解决问题的过程中发展计算思维,提升计算思维能力。

猜你喜欢
图像识别阈值人脸
基于计算机视觉的图像识别技术研究
非均匀光照下文本图像分割算法研究
玻璃窗上的人脸
特斯拉发布新功能 停电期间也可充电
人工智能背景下图像识别技术浅析
智力考场:有趣的图片测试
利用迭代软阈值方法抑制恒时演化类核磁共振实验中的采样截断伪峰
基于字典学习的正则化鲁棒稀疏表示肿瘤细胞图像识别
图像识别交互系统
“领家系”可爱脸VS“高冷系”美人脸