基于自适应卷积神经网络的染病虾识别方法

2022-06-21 08:31刘子豪张素兰贾小军徐志玲
农业机械学报 2022年5期
关键词:染病对虾步长

刘子豪 张素兰 贾小军 杨 俊 张 文 徐志玲

(1.嘉兴学院信息科学与工程学院, 嘉兴 314001; 2.西南科技大学生命科学与工程学院, 绵阳 621010;3.中国计量大学质量与安全工程学院, 杭州 310018)

0 引言

在我国甲壳类水产养殖业中,南美白对虾的养殖占比最高,养殖面积逐年扩大,进出口贸易额逐年递增[1]。然而,对虾养殖业长期遭受病毒、细菌类的病害侵袭,在收获的生鲜虾群中常混有不同类型和不同感染时期的染病虾,在后期的去头、蒸煮、虾壳剥离等加工环节中,如果不及时剔除这些染病虾,会对健康虾群造成大面积污染,导致巨大经济损失[2]。有研究表明[3],易侵入对虾体内的病毒种类一共有100多种,其中最常见易侵病毒有虹彩病毒、桃拉病毒、白斑综合征病毒、黄头病毒、传染性皮下及造血组织坏死病毒等,这些病毒感染性极强、致死率高,是近年来对虾养殖行业的杀手。

针对染病虾的高效智能识别问题,有学者采用不同结构神经网络构建对虾品质的自动检测方法。HU等[4]根据不同虾类在外观表达的特征提出卷积神经网络结构(ShrimpNet),该网络包含2个卷积层、2个池化层和2个全连接层,ShrimpNet的分类精度可达95.48%,所提方法为6种虾类的判别提供了一种高效手段;洪寒梅[5]提出了基于浅层神经网络结合双阈值分割算法的熟虾新鲜度判别算法,根据不同熟虾黑变区域的腐变程度进行颜色特征的提取,导入构建的浅层神经网络进行黑变熟虾的新鲜度分类;HASSAN等[6]认为,采用人工神经网络模型(ANN)可对冷冻生鲜虾的新鲜度进行判定,并指出ANN模型的决定系数为0.987,优于自适应神经网络的模糊推理系统(ANFIS)和响应面方法(RSM),论证了ANN可用于冷冻生鲜虾新鲜度判定的可行性;YU等[7]通过引入近红外高光谱技术评估了生鲜虾的新鲜度,并采用深度学习技术统计高光谱数据,挖掘数据内部的新鲜度判别信息。已有研究为南美白对虾品质检测引入了一种新型的深度学习方法,论证了该方法运用于对虾健康状态判别的可行性。基于以上研究,本团队在前期研究的基础上开展了一系列扩展性的研究工作[8-10]。由于神经网络模型是黑箱,根据以上相关研究,现阶段暂无法揭示其内部的运行机制,对于待分类较为简单的任务尚可满足要求,但是对于复杂样本数据集以及待分类类别较多情况,则无法满足通过训练简单的ANN达成目标,此时需要根据不同图像数据集的内部空间结构和不确定度重构卷积神经网络模型。

虽然国内外已开展较多相关研究,但大多集中于运用单个养殖源样本所建数据集进行算法的测试与更新,当把这些现有方法拓展到多批次对虾样本的识别中,识别精度存在一定程度的震荡,所建模型的稳定性和鲁棒性较差。因此,基于以上问题,本文引入香农信息论,根据不同来源的南美白对虾图像所表达的外观特征差异,构造染病虾识别的卷积神经网络自动更迭模型,采集不同地区对虾养殖池塘样本建立图像数据集测试所建模型的有效性,根据数据集分类前后所呈现熵减规则,构建初始化深层卷积神经网络(DCNN),并依据图像特征与熵特征的对应关系优化网络的卷积核和步长参数,获取DCNN每个卷积层的信息增益的变化量,基于此计算DCNN的最佳深度,构造自适应参数调整的DCNN模型,完成不同来源染病虾的自动识别。

1 研究方法

1.1 对虾图像数据集构建

为了验证本文所提方法的有效性,研究团队在2017—2020年间深入华南、华北以及江浙一带采集南美白对虾样本,分别在杭州市萧山地区、山东省青岛市、广东省湛江市、福建省闽南地区、嘉兴市海宁地区等核心养虾区进行走访和调研,发现这五地均因各种原因暴发过大规模病毒入侵事件,但是不同地区侵染对虾的病毒种类存在差异,例如,江浙地区易侵入病毒[11]主要有虹彩病毒(SHIV)、辛格病毒(LSNV)、桃拉病毒(TSV);华南地区易侵入病毒[12]主要为中国对虾诺如病毒(PVNV)、白斑综合征病毒(WSSV)、野田春偷死病毒(CMNV);华北地区易侵入的病毒[13]主要有传染性肌坏死病毒(IMNV)、细小病毒(HPV)、感染性皮下造血坏死病毒(IHHNV)。因为染病虾易腐败且不宜远距离、长时间运输,因此本研究就地进行图像样本获取,使用不同背景及不同角度的拍摄方式获取图像,使得图像的背景更加多样性。采用Canon(EOS-70D型)相机,配备Sony镜头(EF-S-18-135型),相机像素为5 060万。基于获取的图像样本,建立了5个对虾图像数据集,具体分布如表1所示。

表1 国内南美白对虾样本养殖主要地区获取的图像样本量Tab.1 Shrimp image samples acquired from different shrimp cultivation areas of China 幅

5个地区健康对虾外观并不存在显著差异,部分染病虾在外观上存在差异,该差异可作为采用模式识别方法进行对虾品质判别的基础。图1为健康虾与9种染病虾的图像对比。

图1 健康虾与9种类型染病虾的图像对比Fig.1 Image comparisons between healthy and nine types of diseased shrimp

1.2 图像特征信息熵表示方法

引入信息熵[14]构建不同对虾图像数据集之间的特征差异,论证图像信息熵对DCNN的作用关系。模型在训练过程中,信息熵随着神经网络层数的增加而逐层递减,图像数据集的整体信息熵最大,分类后图像已被转换为一维空间的类别标签,当输出图像类别标签时,信息熵最小,满足熵减规则[15]。熵减规则可使得神经网络内部的有效操作逐层降低DCNN的不确定性,使对虾分类结果越来越明晰,最终使得信息熵逐渐趋向于零。运用信息熵解决多分类问题的前提是把图像特征先转换为熵特征,再进行计算。

为了实现图像与熵特征的相互转换,引入图像整体熵、整体颜色熵、整体纹理熵、整体形状熵、单元颜色熵、单元纹理熵、单元形状熵共七大特征熵[16]。图像整体熵表示图像不确定度,整体颜色熵、整体纹理熵、整体形状熵表示图像中对虾表面颜色、纹理、形状的不确定度,单元颜色熵、单元纹理熵、单元形状熵表示图像中块区域的颜色、纹理、形状的不确定度。图像熵也可理解为图像所具备的各种类型的能量,复杂度越高的图像对应能量就越高,而要消解这些能量则需要设计复杂的超参数组合和构造复杂的DCNN结构。

图像整体熵H可由整体颜色熵H1、整体纹理熵H2与整体形状熵H3之和表示,而且对于每幅对虾图像,分别计算单幅图像的单元颜色熵Hcij、单元纹理熵Htij和单元形状熵Hsij,将各个单元颜色熵之和确定为图像整体颜色熵H1,将各个单元纹理熵之和确定为图像整体纹理熵H2,将各个单元形状熵之和确定为图像整体形状熵H3。在不同养殖源采集的对虾样本在外观上存在差异,这种差异可用熵特征整体与局部之间的对应关系进行表示,即

(1)

式中M、N——局部图像长、宽

i、j——像素下标索引序式(1)中,左边等式描述一幅图像的整体熵等价于该幅图像的颜色熵、纹理熵和形状熵之和,右边等式描述一幅图像整体颜色、纹理、形状的信息熵等价于该图像中各个子区域颜色、纹理、形状的信息熵累加之和,这里子区域的划分要遵循整体与局部的特征等价关系,而且要与网络每层获取的卷积核尺寸(Convolutional kernel size)保持一致。单元颜色熵、纹理熵以及形状熵的计算方法参见文献[17],采用这3种熵特征对局部图像特征进行表示,单幅图像的整体熵特征等价于各个局部子区域的熵特征的累加之和。

1.3 卷积核与步长的自适应优化方法

构建卷积核和步长的自适应优化方法的最初阶段,需要构造一个初始化网络,该网络具有1个输入层、1个卷积层和2个全连接层,如图2所示(SS表示健康虾)。本文讨论的方法将在此网络的基础上进行优化和延展,涉及到卷积核与步长。

图2 初始网络结构Fig.2 Initial network structure

不同地区采集的南美白对虾样本在外观差异上主要体现在颜色、纹理、形状方面,而这些差异可基于1.2节给出的颜色熵H1、纹理熵H2、形状熵H3进行计算。卷积核和步长是设计有效DCNN的两大核心超参数,卷积核表示在某一隐含层进行卷积操作时所选取的卷积核尺寸,即卷积窗口尺寸。卷积核越小,遍历计算越多,输出特征图尺寸越大,反之越小;步长表示在某一隐含层进行卷积操作时,遍历窗口的移动距离,步长越小,遍历计算越多,输出特征图尺寸越大,反之越小。卷积核、步长、输出特征图之间关系参见文献[18]。

图3 卷积核和步长调整策略Fig.3 Diagram of adjusting convolutional kernel and stride strategies

DCNN中的卷积核与步长的自适应优化方法如下:首先,随机初始化卷积操作中的卷积核和步长参数,以这两个参数对原始输入图像进行卷积操作,在对每一个图像进行卷积的同时,安插监控器对每次卷积操作进行监控,并计算当前图像的单元颜色熵、单元纹理熵和单元形状熵,当遍历完一幅对虾图像时,统计以上三者叠加之和与整体图像熵是否满足式(1),若不满足,则终止对当前图像进行的卷积操作,向卷积神经网络输入下一幅图像进行当前层的卷积操作;若满足式(1),则计算整体颜色熵H1、整体纹理熵H2、整体形状熵H3累加之和在H中所占比重,将占比较大的熵依据前期研究结果对颜色、纹理和形状的不同调节策略进行参数更新,再对卷积核和步长进行参数微调。调整参数后,重新对输入图像进行卷积操作,直到图像的整体颜色熵H1、整体纹理熵H2、整体形状熵H3数值相等或三者的递减幅度均超过50%;最后,对DCNN每一层均采用该参数优化方法,即可获取卷积神经网络当前层优选参数,对此DCNN下一隐含层的参数更新则需要获取网络深度之后才可进行,网络深度可根据每次输出的卷积特征图来确定,图3为卷积核和步长参数调整策略实例。

1.4 网络深度自适应优化方法

本文采用的DCNN为多层深度卷积网络结构,图像每遍历一个隐含层则会削减一定的熵值,本文构建一个用于表示在当前网络层中已知特征图后的函数,用于计算数据集从进入当前隐含层到输出特征图之间削减的熵值,如果该数值的递减量变大,不确定性减小,则当前隐含层的信息增益就会变大,因此,熵消减量的计算就显得尤为重要。每输入一幅图像,获取该图像在DCNN中首个卷积层对应的图像整体熵,计算得到图像数据集熵H(D)为

(2)

式中NN——图像数据集中图像的数量

Hl——单幅图像在首层对应的图像熵

l——图像下标索引序算图像数据集在DCNN每层的条件熵H(D|f),其表达式为

H(D|f)=H(f,D)-H(f)

(3)

式中H(f,D)——联合信息熵

H(f)——图像在每层卷积特征图中的图像整体熵

由1.3节可知,在对数据集中每幅图像卷积后,得到一组卷积特征图,以此为基础对图像整体熵进行消减,即求解当前卷积特征图下,图像数据集熵H(D)的变化量,该变化量可表示为式(3)中的条件熵H(D|f)。在式(3)中,生成的特征图对应的熵H(f)可由1.3节求解,而对联合信息熵H(f,D)的计算,可通过DCNN在每层得出一个卷积特征图时,匹配后端全连接层获取单次分类结果。因此,每获得一组卷积特征图,即可求解一次条件熵H(D|f),获取的H(D|f)即可作为判别当前神经网络隐含层熵需消减的数值。

由于卷积神经网络存在多层结构,需要求解经过每层卷积操作后余下的信息熵,因此根据图像数据集的熵H(D)及其在卷积神经网络各层对应的条件熵H(D|f),采用递推公式计算得到卷积神经网络每层对应的信息增益g,递推公式为

g(D,fd)=g(D,fd-1)-H(D|fd)

(4)

根据香农信息论中的信息守恒理论[16-17],输入数据的信息熵应当与输出数据的信息熵保持一致,然而,根据上述说明内容可知,输入图像数据的不确定度经过逐层已知特征条件的解释后,输出数据的不确定度大大降低,因此卷积神经网络中每一层的信息增益必然满足不确定性程度逐层递减规则。若在递减过程中,监测到当前层对应的信息增益g相较上一层对应的信息增益g的增长率不大于50%时,将卷积特征图作为当前输入图像数据输入下一层,继续进行相应的卷积操作,反之,则把当前遍历到的深度作为当前图像数据集的最佳深度d,根据输出的特征图添加两层全连接层的多分类策略,实现健康虾和多种染病虾的识别与分类。

输入DCNN中的图像特征差别越大,网络各层参数越有益于对不同图像进行更好的特征表达。当确定了一幅南美白对虾图像在DCNN中最佳深度d及各层的优选参数,并将最佳深度d所在层的卷积特征图输出,网络则继续获取新输入的对虾图像,并对其进行卷积操作,直至满足卷积运算到d层为止。随着带有不同来源标签的对虾图像不断输入已建网络中,每层卷积核和步长都会发生变化。随着图像样本数量的累积以及导入图像的先后顺序不同,且不同来源对虾之间,健康虾与染病虾之间的熵存在不同,经过以上计算可得到不同图像对应的卷积核和步长,然而不同数据集导入的图像会由量变引起质变,即卷积核和步长会依据不同数据集中呈现的对虾图像类别、每类包含的图像数量以及导入图像的先后顺序而发生变化。由于构建的5个对虾图像数据集中,这3个指标各不相同,因此要调整的卷积核和步长各不相同,卷积核和步长的自适应调整策略如表2所示。

表2 卷积核和步长的自适应调整策略Tab.2 Adaptive adjusting strategies of convolutional kernels and strides

在表2中,C1表示健康虾类别,C2~C4表示部分不同类型染病虾类别;表2中()内数据表示对应类别的样本数量。表2给出的3个指标的变化均会导致所建DCNN中最佳深度d发生变化,网络深度的自适应调整实例如图4所示。

1.5 自适应卷积神经网络构建

1.2~1.4节给出了卷积核、步长以及网络深度的自适应调整和优化方法,是计算特征图的关键,将对整个网络权重参数产生直接影响。传统DCNN中存在较多超参数,例如学习率(Learning rate)、样本批量大小(Batch size)、权重衰减(Decay weight)、像素膨胀(Dilation)、卷积核数量(Amount of convolutional kernel)、卷积核填充量(Padding)等,这些超参数虽然对整个网络的权重生成更新产生作用,但是根据文献[19]的描述,输出的特征图与卷积核、步长及网络深度存在较大关系。自适应卷积神经网络的建构步骤如下:

图4 网络深度的自适应调整实例Fig.4 Example of adaptive adjustment of network depth

(1)构造单层隐含层结构的DCNN,随机初始化DCNN卷积核和步长,依次将各幅对虾图像输入DCNN网络。

(2)采用当前层卷积核和步长对每幅图像进行卷积操作,通过监控器计算当前图像的整体熵H以及整体颜色熵H1、整体纹理熵H2、整体形状熵H3,并计算三者的叠加和是否与图像整体熵H相等。若不等,则终止对当前图像进行的卷积操作;反之,则将整体颜色熵、整体纹理熵、整体形状熵中占比最大值作为参数更新依据,对当前层卷积核和步长进行更新。

(3)采用更新后的卷积核和步长重新导入图像进行卷积操作,直至当前图像对应的整体颜色熵H1、整体纹理熵H2、整体形状熵H3满足预设终止规则,然后将卷积核和步长确定为DCNN当前层的优选参数,将卷积操作后图像确定为卷积特征图,预设终止规则为:整体颜色熵H1、整体纹理熵H2、整体形状熵H3三者相等或者递减幅度超过50%。

(4)根据卷积特征图计算得到当前层信息增益g,监测到当前层信息增益g相较上层信息增益g的增长率不大于50%时,将卷积特征图作为当前图像输入下一层继续进行步骤(2)~(3)的卷积操作,反之,则将当前层对应的深度确定为最佳深度d; 当深度d更新至某个值后,前层信息增益g相较上层的信息增益g的增长率一直不大于50%时,则等到当前训练集所有图像输入网络后,把当前更新后的深度作为最佳深度,并将根据输出的特征图添加两层全连接层的多分类策略,实现健康虾和多种染病虾的分类。

(5)每输入一批次的南美白对虾图像,采用上一批次对虾图像对应的最佳深度d,该深度d会随着输入图像的不同而不断迭代更新,直到满足步骤(4)中网络相邻层信息增益间的数值关系或当前训练数据集中的图像输入完毕,采用参数更新后的DCNN对输入图像进行步骤(2)~(4)的卷积操作。自适应卷积神经网络构建流程如图5所示。

图5 自适应卷积神经网络构建流程Fig.5 Building process of adaptive convolutional neural networks

2 实验

2.1 实验参数确定

实验采用超参数学习率、样本批量大小、权重衰减、像素膨胀、卷积核数量、卷积核填充,根据前期研究中最佳表现的ShrimpNet-3[5]和Deep-ShrimpNet[6]来确定。实验设定学习率为10-4,样本批量大小为128,权重衰减为0.9,实验对每层网络进行裁剪操作,选择裁剪率(Dropout ratio)为0.8,损失函数(Loss function)优化策略采用随机梯度下降规则(SGD)。在DCNN中,每一个隐含层中包含的卷积核数量各不相同,随着网络的加深,输入图像卷积后的特征被压缩,导致卷积核数量不断增加,这里定义首层卷积层的卷积核数量为16,之后逐层以公差为8构建等差数列进行每层卷积核数量的分配,全连接层FC1、FC2根据最后生成的特征图向量确定线性分类为10个类别。训练和测试的对虾图像样本数各占一半,即训练和测试过程中健康虾数量均为7011,染病虾数量为377,健康虾和染病虾图像均在自然场景下采用不同背景获取,构建DCNN的训练和测试过程均采用Python 3.6.2和深度学习工具箱Pytorch 4.0.1,计算机系统采用酷睿i7Gen处理器,32 GB内存,显卡采用GTX1050Ti(4G)GPUs。

2.2 实验结果与分析

2.2.1混淆矩阵

采用2.1节构建的5个对虾图像数据集,总共包含健康虾图像14 022幅,染病虾图像754幅。为验证本文所建DCNN可实现健康虾及每类染病虾的高效分类,建立了表3所示的混淆矩阵。

表3 混淆矩阵实验结果Tab.3 Experimental results expressed by confusion matrix 幅

由表3可知,14 022幅图像中有13 799幅健康虾图像被正确识别,但存在223幅健康虾图像被误识为染病虾,其中被误判为WSSV、SHIV、CMNV、HPV共4类染病虾占比最高,占比分别达到14%、19%、23%、26%。从它们的外观特征来看,部分WSSV染病虾外观的白斑覆盖区域较少,此白斑也通常存在于对虾的附足、虾须、表壳等处,这些细微的白色斑点易与虾体外在的由环境应激反应生成的自然斑点产生混淆,造成误识别;SHIV染病虾往往会在附足上体内虾肉蛋白与氧气结合产生化学反应导致黑变,当黑变区域变小或特征不明显时,易产生误识别;HPV染病虾早期症状往往发生在对虾头胸部的内脏中,内部肝胰脏发生部分塌陷、腐败,之后对虾几乎不进食,导致空肠、红肠等现象,而在DCNN的中低卷积层中,卷积核和步长如果被优选为较大数值,则容易导致此类细节特征容易被忽视,易发生误识别。对于CMNV染病虾,早期发病状态下,其外观形态、颜色、纹理特征都与健康虾相似,导致卷积特征无法学习到CMNV染病虾特有的外观特性,导致误识别。在染病虾识别中,同样存在分类错误的图像,例如PVNV染病虾有3幅图像被误识别为SHIV,LSNV有3幅图像被误识别为PVNV,这些错分的样本除了与它们自身外观特征相似之外,还与获取的图像清晰度、图像复杂度以及图像背景的复杂程度相关。

2.2.2数据集泛化

对所提方法的识别精度以及泛化属性进行实验,结果如表4所示。表4中识别精度是指在单个数据集上得出的实验结果,泛化精度指采用当前数据集构建的DCNN模型,在其他4个数据集上计算对虾识别的测试准确率的平均值,染病虾泛化精度指采用当前数据集构建DCNN模型,在其他4个数据集上的染病虾样本进行识别准确率的平均值,健康虾泛化精度指采用当前数据集构建DCNN模型,在其他4个数据集上的健康虾样本进行识别准确率的平均值,泛化精度+则表示当进行泛化程序时加入本文所提方法得出的泛化精度。

表4 不同数据集的泛化结果Tab.4 Generalization results of different datasets %

实验结果表明,所建模型在数据集5上的识别精度最高,为97.96%,并在其他4个数据集上进行泛化,泛化精度下降幅度均小于5个百分点,且染病虾泛化精度最高达到92.76%,健康虾泛化精度最高达到97.10%。所提方法在数据集5上泛化能力较好,其原因除了与当前数据集所包含染病虾的种类有关外,还与数据集5中所涉及的染病虾外观形态的多样性以及图像样本之间的离散度有关,因为数据集5中包含染病虾图像的复杂度越高,样本图像覆盖范围越广,需要采用更大的信息熵进行复杂度的消减,耗费了较大的能量输出,通过自适应卷积神经网络的训练越容易得出较为鲁棒的模型,所建函数可以极限逼近相似图像空间,获得较为泛化的实验结果。由于不同数据集之间的图像复杂度、同类别的紧实度和不同类别的离散度[16]之间存在较大差别,要适应这些具有不同熵的数据集,泛化精度必定有一定幅度的下降,但当继续在新导入的图像数据开始之后,启用本文所提出的超参数自动优化方法,原始网络又会对卷积核和步长及网络深度进行更新与调整,重新完成DCNN建模,泛化精度提升到与原始DCNN建模同样精度水平。

2.3 图像熵变化实验结果

根据文献[20]描述,单幅图像复杂度由其中物体数量、不同类物体数量、遮挡区域、模糊程度、非对称性、物体覆盖平均面积、复杂物体数量7个指标组成,而不同数据集内部复杂度除了由每幅图像的复杂度组成外,还包含了类别之间的特征重叠度、同类图像间紧实度、线性可分行、空间覆盖率及不同类图像间离散度等[21],这些用于描述数据集复杂度的指标都有对应的函数表示形式[22],描述函数越复杂,所在数据集的熵就越大,这就意味着需要构建较深的DCNN来消解数据集的熵,因为不同深度的DCNN所能拟合的函数不同,随着网络层数的增加,所能表示的函数复杂度越高,恰好可以解决由高数据图像熵所带来的数据集高度复杂的问题,因此本实验从该角度出发得到如图6所示的数据集内部图像熵与网络深度之间的关系柱状图。

图6 不同数据集对应的网络深度Fig.6 Depth of network corresponding to image entropy in different datasets

图6表明,复杂度越高的数据集,其对应的识别难度越大,越需要构建高度复杂的DCNN结构,从而获得较高的识别精度。不同数据集对应的网络深度优化结果存在较大区别,聚焦单个数据集可得出以下规律:染病虾类型较多且数据集复杂度较高的数据集得出的网络深度较大。以数据集3为例,其中包含有3 574幅健康虾图像和215幅染病虾图像,健康虾图像之间的差异较小,但是对于分布在3个病毒侵染类别的染病虾(中国对虾诺如病、白斑综合征病、野田春偷死病),即使属于同一个类别,在其形态、纹理、颜色方面也存在一定差异,这使得该数据集的复杂度较高,需要构建较深的DCNN进行熵的消解。为了进一步阐述单幅图像蕴含的熵与DCNN网络层数之间的关系,图7以数据集3为例展示了熵特征与深度网络层数之间的关系,其中熵特征为整个数据集熵的平均值。

图7 图像熵与深度网络层数之间的关系Fig.7 Relationship between image entropy and depth of deep network

图7a为数据集3整体熵对随机批次梯度下降(SGD)在DCNN中的变化趋势图,在图7a中,整体熵在DCNN的前5层下降迅速,后面下降速度开始逐渐放缓,原因主要是输出卷积特征图的有效性,DCNN前5层提取的对虾特征对染病虾的识别起到了关键作用,因此在后期为了把所提方法用于在线识别,该DCNN可缩减为一个具有5层结构的精简网络;在颜色熵方面(图7b),其在DCNN的前10层下降迅速,尤其显著的是前3层下降尤为迅速,10层之后下降速度开始逐渐放缓,说明颜色特征在识别染病虾的过程中起到了极为关键的作用,因此造成前3层下降迅速;在纹理熵方面(图7c),纹理熵在DCNN的前8层下降迅速,前4层下降尤为迅速,8层之后下降速度开始逐渐放缓,说明不同养殖源对虾在纹理特征的表达差异可通过所构建DCNN的前4层予以提取,这与在整体熵及颜色熵中分析的结果相一致,也体现了纹理特征的重要性;在形态熵方面(图7d),来自不同源头对虾在外观形态上的差异不明显,整体形态熵下降趋势比较平缓,说明形态特征随着网络层数的加深逐渐提取完成。

针对DCNN中的熵逐层衰减机制是否可以等价于把原始图像数据的高维空间降解为低维空间的问题,本文绘制了如图8所示的散点图,其中不同颜色的实心圆点表示不同的对虾类别(9类染病虾和1类健康虾)。从数据集1~5中,各类别分别抽取80幅图像进行降维实验,图8a~8f表示DCNN中从第1层到第6层的原始数据集图像样本的降维褪熵结果。

图8 各类图像复杂度随DCNN逐层降维褪熵过程Fig.8 Various image complexity declining processes by deepening into DCNN layers

由图8可知,随着DCNN隐含层数的逐渐加深,各类样本在由颜色熵和纹理熵构成的二维空间的聚合程度越来越好,而且随着各类样本的精确耦合,颜色熵和纹理熵的数值也在逐层下降,尤其在前5层之内下降迅速,这与图7的实验结果高度吻合。随着DCNN层数加深,各类朝着最有利于优化特征表达的方向聚合,其主要原因在于借助信息守恒定律把熵的衰减量与新生成虾关键部位的新特征产生了关联,例如对于WSSV染病虾,在输出的特征图中会生成携带着对虾触角、附足、虾壳等处的白色斑点特征,这种白色斑点一旦形成,当前网络层对应的纹理熵和颜色熵就会定量消减,产生关联效应,此类关联的例子也可从HPV、PVNV、CMNV等染病虾例子中给予说明,这对从香农信息论角度解释深度卷积神经网络的内部运行机制具有重要意义。

为了验证所提方法的优越性,本文将所提方法与其他文献中的对虾识别方法进行比较,实验结果如表5所示,其中测试精度为5个数据集的平均测试精度,以上测试精度和泛化精度的测试都进行了5组实验,表5为5组实验结果的平均值。

在传统对虾品质识别研究中,研究者尝试构建精密且高复杂度的对虾特征提取与识别算法,例如ECO组合特征[23]、对虾形态骨架几何特征[24]、特征黑变分割[25]、完整性检测[25]、组合法[26]、迭代法[27]等,这些方法虽然在某些特定问题中可取得较高识别精度,但是泛化能力较弱,即使是针对同一地区、同一养殖池塘以及同一养殖环境的南美白对虾样本,都会存在准确率退化现象,因此后来有学者针对该问题提出采用不同的浅层和深层神经网络方法,例如浅层神经网络[2]、改进LeNet网络[5]、改进AlexNet网络[6],虽然这些网络有助于解决这些问题,但是难以确定深度网络中的未知参数以及结构,单纯靠试错方式无法获取高效的深度网络模型。本文方法可以解决此类问题,提升了网络执行的效率,减小了由于样本图像数据泛化带来的精度振荡问题。本文方法的测试精度可以达到97.83%,高于其他方法的测试精度,而且本文方法对于传统方法是一次全面的泛化精度提升,相比于改进AlexNet网络,本文方法提升了6.88个百分点。

表5 本文方法与其他对虾识别方法性能比较Tab.5 Results comparison between the proposed method and other shrimp recognition methods %

3 结论

(1)首先引入香农信息论将不同来源对虾所建数据集的复杂度通过颜色、纹理、形状进行熵特征表示,把原始数据集的图像导入初始化DCNN网络中,依据输出特征图建立卷积核和步长的优化方法;然后,根据熵减规则依次计算每一卷积层被消减的熵,建立网络深度优化策略;最后,根据具有不同复杂度的数据集进行参数更新和调整,获取最佳的DCNN网络参数和结构。

(2)实验结果表明,DCNN网络模型的性能表现与数据集复杂度及其中图像数量都具有一定关系,这也解释了在不同数据集上构建DCNN所能逼近的函数差异的较大差异,而样本越多越有利于网络模型学习到众多样本中隐藏的特征空间分布特性,对最终的模型测试精度和泛化精度具有较大贡献。实验也证实,本文引入信息熵可以有效表征DCNN每层输入图像复杂度递减特性:随着DCNN层数递增和网络结构加深,数据集的整体信息熵存在逐步递减规律。从实验数据上来看,所建模型在单个数据集上的识别精度最高为97.96%,并在其他4个数据集上进行泛化,泛化精度下降幅度均小于5个百分点。

猜你喜欢
染病对虾步长
对虾养殖弱势群体的管理
偶感
对虾吃料慢的原因分析和处理
炭疽和狂犬病相互作用模型的稳定性分析
斗 虾
活着
董事长发开脱声明,无助消除步长困境
步长制药50亿元商誉肥了谁?
起底步长制药
可爱的对虾