儿童阻塞性睡眠呼吸暂停计算机人脸辅助诊断综述

2021-12-07 10:10宋文爱邰隽杨吉江王青李晓丹雷毅邱悦
计算机应用 2021年11期
关键词:分类器关键点特征提取

赵 津 ,宋文爱,邰隽,杨吉江,王青,李晓丹,雷毅,邱悦

(1.中北大学软件学院,太原 030051;2.首都儿科研究所附属儿童医院耳鼻咽喉头颈外科,北京 100020;3.清华大学自动化系,北京 100084;4.首都医科大学附属北京儿童医院耳鼻咽喉头颈外科北京 100045)

0 引言

1976 年儿童阻塞性睡眠呼吸暂停(Obstructive Sleep Apnea,OSA)被Guilleminault 等[1]第一次提出,之后阻塞性睡眠呼吸暂停综合征被定义为上气道间歇性完全阻塞或部分阻塞,这种疾病会影响睡眠质量,常伴有睡眠碎片和间歇性低氧血症[2],由OSA 引发的慢性间歇性夜间低氧血症和睡眠不足可能会导致神经行为问题、心血管疾病和精神疾病综合症等重大风险。根据调查显示儿童OSA 患病率为1.2%~5.7%[3],我国香港地区的儿童OSA 患病率为4.8%[4]。可见OSA 严重影响儿童的身心健康,并对未来的长期健康产生深远影响。所以,对于儿童OSA患者来说,初期发现和诊断至关重要。

儿童 OSA 的诊断一般是通过多导睡眠图(PolySomnoGraphy,PSG)以及针对儿科的诊断标准来实现的[5]。根据文献[6]可知,在面部特征方面,推荐重点关注腺样体面容;文献[7-8]中分析了腺样体面容,面部特征变化主要集中在眼睛、鼻子、嘴唇。这些面部特征也可用于儿童OSA的预测中。临床数据中一般收集人口统计学特征如身高、体重、颈围、腹围、臀围和PSG检测中的睡眠参数。在诊断时,把PSG数据中的阻塞性呼吸暂停低通气指数(Obstructive Apnea/Hypopnea Index,OAHI)>1 次/小时作为儿童OSA 的诊断界值指标,有利于早期发现和干预治疗。此外呼吸暂停低通气指数(Apnea Hypopnea Index,AHI)、阻塞性呼吸暂停指数(Obstructive Apnea Index,OAI)和最低血氧饱和度对儿童OSA诊断也有重要参考作用。对于儿童OSA严重程度诊断指标,参考标准如下:1)轻度为1次/时10 次/小时。不管是联合或者单一的体征和症状,都可以结合PSG 数据来提高诊断的准确性[6]。

在偏远地区和医疗条件差的区域,不可能每个人都进行PSG监测,造成对儿童OSA的诊断困难很大,所以非常需要计算机进行辅助诊断。随着人工智能等领域的发展,使用计算机辅助诊断这类疾病,可以帮助早期发现和诊断儿童OSA,改善了偏远地区医疗资源不足等问题。

1 相关领域研究现状

传统的人脸辅助诊断的研究最先是提取图像上的浅层特征,如纹理特征、几何特征、颜色特征进行辅助诊断,如:Balaei等[9]通过提取到的脸部宽度、眼睛宽度、颈心角和下颌长度等几何特征,使用逻辑回归分类器来预测OSA;Song等[10]通过提取内眦赘皮、黑素细胞痣的纹理特征,前额、鼻梁和眼睛之间的几何特征预测特纳综合征;Schneider 等[11]提取纹理和几何特征预测指端肥大症。随着神经网络的发展,可利用神经网络提取图像中的深度特征进行辅助诊断,如:Kumov等[12]使用神经网络提取图像的深度特征,并融合了几何特征来预测8种遗传病症,平均分类精度达到了约93%;Balaei 等[9]把正脸和侧脸图像作为输入向量,输入到前馈神经网络中进行分类,然后又选择脸部特定的四个特征输入到神经网络中进行分类,结果显示对于使用脸部特定位置的四个特征进行预测,与直接使用正脸和侧脸图像进行预测相比准确率有所提高。

传统的诊断方法由于可供训练的数据集较少,神经网络不能充分地发挥其性能,迁徙学习的提出,解决了数据集短缺的问题,充分发挥了神经网络的分类性能。迁徙学习按照迁移方案划分,可以分为归纳迁移学习、直推式迁移学习、无监督迁移学习;如果按照迁移学习方法划分,可以分为实例学习、基于特征表示的迁移、基于参数的迁移、基于相关性的迁移。目前使用迁移学习来诊断儿童OSA 的相关研究非常有限,迁移学习可以有效地解决儿童OSA数据短缺问题。

与二维图像相比,3D 人脸数据包含更多的信息,可以提高诊断的准确性,也是疾病辅助诊断研究的重要领域。最先的研究是提取3D 人脸数据上的局部特征进行疾病的预测,如:Kiaee 等[13]提取3D 人脸模型上的等高线、曲率和水平曲线,将提取到的特征用拓扑数据分析方法进行分类;Wu[14]利用儿童的3D 人脸数据,计算线性和角度测量值,采用三维形态计量学分析来评估高危人群和低风险人群面部特征的差异。随着深度学习的发展,设计更加庞大复杂的神经网络,可以提取3D 人脸数据上的深度表型特征来进行辅助诊断。如Kiaee 等[13]的研究,3D 人脸数据理论上可以捕捉到儿童脸上微小的面容变化,更好地预测儿童OSA,但由于3D 人脸数据数量少,目前的研究不是很理想。

2 儿童OSA人脸辅助诊断步骤

传统的计算机人脸诊断方法、基于迁移学习的诊断方法、基于3D人脸数据的诊断方法中的主要步骤如下:

1)传统的儿童OSA 人脸辅助诊断。一般首先获取脸部图像并进行人脸检测、图像预处理、人脸关键点检测、面容特征分析,然后提取人脸特征,最后进行分类预测。传统的儿童OSA人脸辅助诊断流程如图1所示。

图1 传统的儿童OSA人脸辅助诊断流程Fig.1 Flow chart of traditional face aided diagnosis of OSA in children

2)基于迁徙学习的儿童OSA 辅助诊断。首先使用成熟的神经网络在大规模人脸数据集上进行训练,然后把经过预训练的神经网络模型作为人脸特征提取器,再根据目标任务调整分类器,并利用目标域的数据集进行微调来预测儿童OSA。基于迁徙学习的儿童OSA 辅助诊断流程图如图2所示。

图2 基于迁移学习的儿童OAS诊断流程Fig.2 Flow chart of OAS diagnosis in children based on transfer learning

3)基于3D 人脸数据的儿童OSA 辅助诊断与传统的辅助诊断类似,一般先获取3D 人脸数据、3D 人脸重建、特征提取,再分类预测。基于3D 人脸数据的儿童OSA 辅助诊断流程如图3所示。

图3 基于3D人脸数据的儿童OAS诊断流程Fig.3 Flow chart of OAS in children diagnosis based on 3D face data

3 传统儿童OSA人脸诊断

传统的儿童OSA人脸诊断主要步骤如下:

1)图像获取。一般都是在医疗机构,在统一的环境下,由专业的人员使用统一的设备进行拍摄,采集正脸和侧脸的面部图像。对于图片的标签可以根据文献[6],利用OAHI 指标进行标注。

2)人脸检测。把图像中的人脸区域裁剪出来。人脸检测是辅助诊断中重要的基础任务之一,人脸检测算法可以分为基于特征的人脸检测和基于图像的人脸检测,例如基于AdaBoost的算法和基于神经网络的算法都是基于图像的。人脸检测常用的算法有VJ(Viola and Jones)人脸检测[15],VJ 人脸检测器用多个AdaBoost 分类器筛选人脸候选框,每个弱分类器使用Haar-like 特征进行分类,所有的弱分类器集合起来判定人脸区域,随后更多的特征被考虑,比如:一些扩展的Harr 特征、基于聚合通道的特征等。基于AdaBoost 的算法还有FloatBoost 算法、可变形的组件模型等;基于神经网络的算法有级联卷积神经网络(Cascaded Convolutional Neural Network,Cascade CNN)[16],Cascade CNN 不仅结合了VJ 人脸检测器的优点,还在每一级分类器中使用卷积网络作为分类器,用于提高检测的精确度,基于神经网络的算法还有DenseBox、多任务级联卷积神经网络(Multi-task Cascaded Convolutional Network,MTCNN)等。在儿童OSA 辅助诊断中,人脸检测可以减少背景对实验的影响。Qin 等[17]使用人脸图片识别唐氏综合症,对于进行了人脸检测等预处理的数据集准确性高达95.87%,对没有进行人脸检测等预处理的数据集准确性仅仅只有57.87%,可见人脸检测是重要的一环。参考文献[18-19],人脸检测方法的优缺点对比如表1所示。

表1 人脸检测方法的优缺点对比Tab.1 Comparison of advantages and disadvantages of face detection methods

3)图像预处理。消除光照等环境因素对实验的影响,提高图像的清晰度,一般对人脸图像进行翻转和图像增强。传统的图像增强方法有归一化、灰度变换、直方图均衡化等;深度学习中,在不改变网络模型的情况下,通过图像增强的方法提高了分类的准确性,在深度学习中常见的数据增强方法有几何增强、色彩增强、mixup、随机擦除等。

4)人脸关键点检测。检测人脸关键点,在儿童OSA 诊断中也是一项重要的基础任务。对于儿童OSA 的面容特征,重点关注眼睛、嘴唇、鼻梁等关键区域。人脸关键点检测大致可以分为三类:基于统计模型的方法、基于级联形状回归的方法、基于深度学习的方法。基于统计模型的方法包括点分布模型(Active Shape Model,ASM)[20]和形状统计模型(Active Appearance Model,AAM)[21],ASM[20]把人脸关键点坐标组合成形状向量,随后提出的AAM 算法[21]加入了形状约束,适用范围都有所提高;基于级联回归的方法把关键点问题转化为一个回归问题。在训练阶段,回归模型学习预测关键点的位置函数,预测时,直接用这个函数输出关键点的位置坐标。常用的人脸关键点检测的个数有两种:一种是检测人脸上的5个关键点;另一种是检测人脸上的68个关键点。68个人脸上的关键点标记出眼睛、嘴巴、鼻子、眉毛、大致的脸部轮廓[10],如图4(文献[10])所示。根据的儿童OSA 的面容特征,可以检测眼睛、鼻子、嘴唇上部、腮部等关键点,在儿童OSA 的诊断中,检测出人脸上的68 个关键点可以更好地捕捉到儿童变化的面容特征。如Dlib 库中的级联回归梯度下降树(Gradient Boosting Decision Tree,GBDT)[22]检测人脸的68 个关键点,首先在特征池中挑选两个点,然后计算每张图片与这两个点之间的像素差,再随机产生一个数值,如果像素差大于这个数值则向右分类,反之向左一直分裂至叶子节点,且二叉树深度已经确定,不断更新回归树,最终输出模型,级联回归的算法还有基于回归树的人脸对齐(Ensemble of Regression Trees,ERT)算法等。基于深度学习的方法在关键点检测上表现优异,如当前在检测人脸68 个关键点中表现优越的实用的人脸特征点标记(Practical Facial Landmark Detector,PFLD)模型[23],其在损失函数中,通过给少量样本包括侧脸、正脸、头朝上、头朝下、表情、遮挡等赋予更多的属性权重,角度偏差大的样本赋予更多的角度权重,同时将3D姿势的估算与2D距离的测量结合起来,对于姿势较大和遮挡的人脸图像关键点识别的精度也很高。人脸关键点检测的精确与否对于下一步的特征提取至关重要,人脸关键点检测作为基础工作中重要的一环,影响着儿童OSA 预测的准确度。本节参考了文献[19]和文献[24],人脸关键点检测的优缺点对比如表2所示。

表2 人脸关键点检测方法的优缺点对比Tab.2 Comparison of advantages and disadvantages of face keypoint detection methods

图4 人脸关键点检测Fig.4 Face keypoint detection

5)面容特征分析。将每种类别照片上的关键点进行线性变换,生成每个类别的平均脸,通过热力图或皮尔逊相关系数矩阵等方法分析不同平均脸之间的面部差异和变化,如:文献[7]使用平均脸绘制人脸68 个点之间的相关系数矩阵和热力图,分析腺样体肥大的面容特征;文献[25]计算每组中平均面部灰度的差值并显示为热力图,分析儿童阻塞性睡眠呼吸暂停综合征在术后的面容特征。面容特征分析对于医生的诊断和接下来的特征提取具有很大的参考价值。

6)人脸特征提取。人脸特征提取是儿童OSA 辅助诊断中最重要的一步,直接影响着儿童OSA 预测的准确性。人脸特征提取大致可以分为两个方法:一种是提取几何、纹理、颜色特征;另一种是使用神经网络提取深度特征。根据引言中所述的儿童OSA 面容特征,主要对眼部、嘴唇、鼻梁方面特征提取的方法进行了介绍和研究。

对于人脸几何特征的提取一般是使用关键点之间的欧氏距离进行测量。针对儿童OSA 中的面容特征,可以计算眼睛之间的欧氏距离和鼻梁之间的欧氏距离作为特征进行分类,如:Balaei 等[9]提取眼睛宽度进行OSA 的预测;Song 等[10]提取眼睛和鼻梁之间的欧氏距离对特纳综合征进行诊断预测。对于人脸照片从3D 投影到2D 时,脸上关键点之间的实际距离有很大的差别,可能会对提取的几何特征产生影响。为了消除这个影响,Kumov 等[12]用2D 人脸坐标进行3D 人脸重构,然后再提取特征。提取纹理特征最常用的方法是Gabor 小波变换,如:Song 等[10]在预测特纳综合征时,对眼睛区域在每个方向上分别对5个标度的Gabor滤波结果求平均,然后将平均结果合并为一个向量,进而提取眼部向量特征;武佳丽[26]使用8个方向、5 个尺度的Gabor 滤波器提取嘴唇的纹理特征。Gabor 滤波器经过一系列多尺度和多方向的滤波器组对图像进行卷积,可以提取到空间局部的低频特征,但可能会丢失特征信息,而且提取到的特征信息维度高,数据庞大。为了解决这个问题,除了使用常见的主成分分析(Principal Component Analysis,PCA)法进行降维外,倪永婧等[27]研究了二维Gabor小波与非对称的邻域梯度编码(Asymmetric Region Local Gradient Coding,AR-LGC)算子相结合的人脸特征提取,可以更好地提取图像的局部纹理信息。提取颜色特征的常用方法包括颜色直方图、颜色矩、颜色集等。颜色直方图反映了图像中颜色的分布,可以比较图像间的颜色差。而颜色集则是通过建立索引表进行特征检索,如Chen等[28]根据嘴唇的颜色特征提取嘴唇边缘,获得上唇和下唇之间的轮廓并拟合曲线,用提取到的嘴唇特征诊断慢性疲劳综合症。而神经网络提取到的深层人脸特征,可以捕捉到儿童面部特征的微小变化,提高儿童OSA 的分类精度,如Lin 等[29]使用深度卷积神经网络(Deep Convolutional Neural Network,DCNN)把病人的正脸、头顶、左侧60°和右侧60°的四个图像输入到DCNN 中检测冠心病。人脸特征提取方法的优缺点对比如表3所示。

7)数据降维。数据降维对计算机辅助诊断的准确率尤为重要,常用的方法有主成分分析(PCA)和线性判别分析(Linear Discriminant Analysis,LDA),如Kumov 等[12]对提取到的特征进行降维后,分类准确度显著提高。

8)分类器分类。根据疾病的类型可以分为单一疾病的单一症状、单一疾病的多种症状、多种疾病的多种症状,常用的分类器有最近邻算法(K-Nearest Neighbor,KNN)、支持向量机(Support Vector Machine,SVM)、AdaBoost、DCNN 等。本文是针对儿童OSA进行研究,用多个面部特征去预测儿童OSA,主要关注单一疾病的多种症状。单一疾病的多种症状用到的分类器大致可以分为两种:一种是使用AdaBoost;另一种是根据不同特征选择不同的分类器。文献[30]中使用逻辑回归(Logistic Regression,LR)、KNN、SVM 和卷积神经网 络(Convolutional Neural Network,CNN)对不同的特征进行分类来诊断指端肥大症,使用了加权算术平均值的策略,其中相应的权重通过最小二乘法计算。

4 基于迁移学习的儿童OSA辅助诊断

随着大规模数据库VGG-Face[31]和ImageNet[32]的建立和神经网络的发展,迁移学习广泛应用于医疗领域。如:Van Ginneken 等[33]和Shi 等[34]使用迁移学习的方法检测肺结节;Esteva等[35]使用迁移学习的方法诊断皮肤癌;Gurovich等[36]使用迁移学习的方法来预测罕见的遗传综合症,准确率高达91%;Qin 等[17]在大规模人脸数据集上,使用迁移学习的方法来预测唐氏综合症,达到了95.87%的准确率,93.18%的召回率和97.40%的特异性;Jin 等[37]使用迁移学习的方法对β地中海贫血症进行二分类,微调后的模型达到了95.0%的精度,对于多疾病的分类,用迁移学习预训练了一个特征提取器,并用SVM 进行分类,精确度达到了93.3%。由此可见,在大规模数据库上训练后,深度卷积神经网络可以学习到强大的分类能力,理论上可以捕捉到儿童面容特征的微小变化。

4.1 深度卷积神经网络

随着深度学习[38-39]的发展,深度卷积神经网络(DCNN)以优良的性能被世界上研究者广泛使用。卷积神经网络(CNN)可以在多个以数组形式出现的输入数据(如彩色图像等)中学习特征。CNN有四个关键特征:权重共享、部分连接、池化、多个层的共同作用。因为前几层的卷积层提取通用特征,最后几层提取更原始的特征,所以CNN 不仅有足够的能力来识别相似的图像中潜在的细微差别,还可以学习图像中深层次的语义信息。不同的特征图可以检测局部特殊的图像特征。在不同位置的单元之间由于权重共享,在检测图像时,可以学习到图像间相似的特征。池化层可以减小特征图的尺寸,不仅为小的偏移和变形创建不变性,还可以把语义上相似的特征合并为一个。但是CNN 通常需要在大规模数据集上才能发挥其全部潜力,所以在大规模数据集上进行迁移学习,然后用小规模的儿童OSA 数据集进行微调,可以发挥出巨大的潜力。如:Van Ginneken 等[33]使用OverFeat[40]经过迁移学习后来诊断肺结节;Shi等[34]使用VGGNet-16[41]经过迁移学习后诊断肺结节;Yu 等[42]使用VGGNet-16[41]和ResNet-50[43]对医学图像进行分类;Esteva 等[35]使用GoogleNet Inception v3[44]诊断皮肤癌。对于人脸图像的诊断,如:Gurovich 等[36]使用深格塔式的深卷积神经网络结构,该网络由10 个卷积层组成,来预测遗传病;Qin 等[17]用10 个卷积层的DCNN,并用大内核分解为多个较小内核的多层网络模型,并在大规模人脸数据集CASIA Web-Face[45]上进行迁移学习来预测唐氏综合症;Jin等[37]使用5个卷积层的DCNN进行疾病分类。

表4 总结了医疗领域方面使用的迁移学习的网络模型结构。

表4 医疗领域使用的迁移学习网络模型及相应的源域数据集Tab.4 Transfer learning network models used in medical field and corresponding source domain data sets

4.2 迁移学习

当在小规模数据上进行训练时,容易发生过拟合。为了解决某类数据短缺的问题,迁移学习[46]被提出。对于迁移学习的儿童OSA 辅助诊断的分类,如果按照迁移学习的方案划分,由于目标域和源域的分类任务不同,属于归纳迁移学习;如果按照迁移学习方法划分,它将转移的知识编码为共享参数,则属于基于参数的迁移学习[46]。在迁移学习的深度网络模型中,特征提取和分类在一个统一的结构下,检测速度和性能都有所提高。由于源域和目标域的人脸数据集在特征空间上一致,当在大规模VGG-Face[31]等人脸数据集上对模型进行训练时,可以学到丰富的先验知识。当迁移学习时,通过参数的转移,把大量的先验知识转到了目标域的分类上,可以提高目标域的分类准确度。

4.3 微调

在大规模人脸数据上学到先验知识后,需要在小规模的儿童OSA 数据集上进行微调,从而更好地进行分类。微调的方法可以分为以下两种:

1)把最后一层的全连接层替换为目标分类任务的线性分类器(如Softmax、SVM 等),剩下的网络被当作特征提取器在目标域的数据集上训练新的分类器。如Qin 等[17]和Shi 等[34]等只微调最后一层,然后训练新的分类器。

2)不仅仅只训练最后一层的分类器,以合适的学习率和神经网络的反向传播机制微调所有层的参数。如Shi 等[34]冻结除最后一层的全连接层,并将其替换为合适的分类器,然后使用反向传播微调所有层。

5 基于3D人脸数据的儿童OSA诊断

与二维人脸图像相比,三维人脸数据对于光照、遮挡、人脸姿态的鲁棒性更高。同时,三维人脸数据中的表型特征被广泛用于医疗领域,极大提高了疾病诊断的准确性[47]。3D 人脸数据的儿童OSA辅助诊断主要流程如下:

1)获取3D 人脸数据。医疗领域的人脸三维成像有以下几种,如电子计算机断层扫描(Computed Tomography,CT)、锥形束CT(Cone Beam CT,CBCT)、微计算机断层扫描(Micro CT,MCT)、3D 激光扫描、结构光技术、立体摄影测量技术和磁共振成像(Magnetic Resonance Imaging,MRI)[48]。在儿童OSA 诊断中常用的有:①CT,如程超等[49]使用CT 帮助医生正确判断上呼吸道狭窄或梗阻部位,提高手术效率;②3D 激光扫描,如深度图;③结构光技术,如点云,Wu[14]利用点云结构分析高风险和低风险人群间的面部差异;④立体摄影测量技术,如三维可变形模型(3D Morphable Model,3DMD)系统、网格等。儿童OSA 常用的3D 人脸数据总结如表5 所示。图5(参考了文献[50])显示了三种常用的人脸三维结构示意图。

表5 常见的三维人脸数据获取方法的特点对比Tab.5 Characteristics comparison of common 3D face data acquisition methods

图5 三种常用的三维人脸结构Fig.5 Three commonly used 3D face structures

2)图像预处理:去除掉3D人脸数据上对于实验有影响的特征,如眼镜、首饰头发等,使用平滑和孔洞填充等过滤器对3D 人脸数据进行重采样和预处理并检测人脸的位置和方向[13,50]。

3)三维人脸重建。将三维图像进行融合配准,生成完整的三维人脸数据,如点云数据的重建:将深度图像进行数据增强,然后进行点云计算和配准,最后融合点云数据,获得高精度的3D人脸数据。

4)三维人脸特征提取。与二维人脸特征一样,同样包括传统方法和使用深度神经网络的方法。传统方法直接在3D人脸数据上测量关键点之间的线性距离和角度,如文献[51-53]方案使用线性距离和角度来测量OSA患者的3D人脸数据结构,因为线性距离容易受尺寸的影响,当两个不同测量对象缺少相对位置信息时,可能会产生相同的形状信息,所以在形状分析上造成很多困难。为了改进这些问题,文献[13]方案提取3D 人脸模型上的持久同源性来诊断儿童OSA,因为持久同源包含了几何特征和拓扑特征,所以结合了几何的区分能力和拓扑的分类能力[54];文献[14]方案则提取3D人脸数据上的几何形态计量学(Geometric Morphometry Metrology,GMM)来诊断儿童OSA,GMM 不仅可以对整体形状进行分析,还可以减少偏差[55];也可直接使用神经网络自动去提取深度表型特征,如文献[13]方案。但是由于3D 人脸数据复杂且数量少,而且神经网络需要更多的层数和复杂的参数,所以神经网络无法发挥出其潜在的性能,导致目前儿童OAS 的研究并不理想。3D人脸数据特征提取总结如表6所示。

表6 3D人脸数据特征提取方法的特点对比Tab.6 Characteristics comparison of 3D face data feature extraction methods

5)分类。对提取到的特征进行分类,如机器学习方法、深度神经网络、高维正则化判别分析模型等。

6 结语

本文综述了儿童OSA 计算机人脸辅助诊断的三种技术路线。儿童OSA 作为一种发病率较高、并发症严重的疾病,影响着儿童的健康发育,需要尽快建立一种快捷方便的诊断方式,提高诊断的准确性。

在二维人脸图像中,传统的图像处理技术也在不断地发展,神经网络在人脸检测、人脸关键点提取、人脸特征提取、疾病分类等方面在未来将会有更大的发展,但是还有很多问题值得研究:寻找更好的模型和方法来检测人脸,以消除背景对实验的影响;对于遮挡、姿态较大等问题的人脸图像如何更好地提取关键点;使用神经网络如何更好地提取图像的深度特征来进行诊断预测,都需要建立更好的模型,不断地进行参数优化。同时侧脸相较于正脸图像,可以提供更多的关于嘴唇、鼻梁、耳朵等特征信息,侧脸可以与正脸特征结合起来提高儿童OSA预测的准确性。

3D 人脸数据虽然成本高,实施困难,临床应用性低,但是与2D 人脸相比,不受焦深的影响,焦深会在2D 图像中产生明显的形貌失真,影响预测的准确性。虽然目前对于儿童OSA的3D面容研究还没有取得突破进展,且现有的研究中由于数据量较少,导致研究结果不是很理想。但随着研究的不断深入,将有更多的3D 人脸局部特征提取方法被提出,可以更好地识别儿童面部变化。通过神经网络提取3D 人脸上的深度表型特征也是未来研究的重点,深度表型特征可以提取到3D人脸上更深层的特征信息,更加精细地捕捉到儿童的面部变化,但同时需要建立庞大的数据库和复杂的神经网络结构。

随着2D、3D、视频等更多人脸数据库的建立,如最近刚开源的大规模人脸数据集MAAD-Face,使用迁移学习可以有效地缓解儿童OSA 二维或三维人脸数据的短缺问题,同时也要避免负迁移,更好地优化迁移算法,完成目标域中的分类任务。迁移学习也是未来研究的趋势之一。

对于条件允许的地区,儿童OSA 中的一些临床数据也可与图像数据相结合,提高儿童OSA 诊断的准确性。在未来,还要建立、建全儿童OSA 的图像数据库,不仅可以加快儿童OSA 辅助诊断的发展,也可以为其他相关联的儿童疾病提供数据来源和技术参考。

猜你喜欢
分类器关键点特征提取
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
学贯中西(6):阐述ML分类器的工作流程
论建筑工程管理关键点
肉兔育肥抓好七个关键点
基于朴素Bayes组合的简易集成分类器①
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
利用定义法破解关键点