带质心的K最近邻增强模糊最小最大神经网络的集成方法

2021-10-19 03:14赵建成余肖生

重庆理工大学学报(自然科学) 2021年9期

陈鹏，赵建成，余肖生

(三峡大学计算机与信息学院，湖北宜昌 443002)

解决稳定性-可塑性难题是ANN学习中的关键问题，尤其是当数据样本的数量随时间增加时，ANN模型必须以自主和增量的方式学习这些样本。为了解决稳定性-可塑性难题[1]，Simpson[2]提出了2种混合的ANN模型(Fuzzy Min-Max(FMMN)网络)，即模式分类的监督模型；模式聚类的无监督模型[3]。FMMN使用超盒模糊集在其网络结构中创建和存储知识，即作为隐藏节点，该网络已经得到了广泛的研究与应用，尤其是在分类任务上[2]。为了提升FMMN网络的性能，Mohammed等[4]提出了增强的模糊最小-最大神经网络(EFMMN)，该算法在解决超盒的重叠测试和收缩测试时都更加有效。为了避免在获胜超盒附近产生过多的小超盒，从而降低FMMN的网络复杂度，Mohammed等[5]提出了K最近邻超盒展开规则的改进的模糊最小最大神经网络，实验表明通过该网络可以有效地降低网络的复杂度。Nandedkar等[6-7]提出了通用反射模糊最小-最大神经网络(GRFMN)。 GRFMM将FMM聚类和分类算法以及人体反射机制的概念组合到一个通用框架中，以解决重叠问题。刘金海等[8]提出了一种基于数据质心的模糊最小最大神经网络分类方法，该方法能够根据实际数据的质心特征自适应地调节超盒隶属度，从而来提高分类的精准率。

为了使FMMN实现半监督的能力，Ngan等[9]提出了模糊最小最大神经网络中的半监督聚类。Liu等[10]提出了一种基于模糊最小最大神经网络的半监督分类方法(SS-FMM)。在SS-FMM中，对模糊最小最大网络进行了修改，以处理标记和未标记的数据。

现有的FMMN及其变体，在训练网络以及进行最终预测时，都没有考虑之前训练的样本位于该超盒内的大体分布情况，仅计算样本点的隶属度的高低来选择扩展的超盒，这样不利于超盒更加准确的收缩以及最终精准的预测。同时，现有方法都过于依赖扩展系数的选择，如果选择糟糕的扩展系数，则会导致模型性能变差，另外对于每个数据集选择最佳的扩展系数也是非常耗费时间的事情。因此，提出了带质心的K最近邻增强模糊最小最大神经网络的集成方法(ensemble method ofk-nearest neighbor enhancement fuzzy minimax neural networks with centroid，简称为E-CFMM)，该方法考虑了每个超盒数据集中的位置，即增加质心的同时，又集成了5个不同的扩展系数的弱分类器，并将5个弱分类器的预测结果作为随机森林的输入数据进行再训练。这样既可以不用考虑扩展系数的问题又能提高整体网络的预测性能。

1 K最近邻增强模糊最小最大神经网络

1.1 基本的模糊最小最大神经网络(FMMN)

FMMN的网络结构由3层组成，如图1所示。首先，Fa是输入层，其输入节点数等于输入要素数。其次，Fb是超盒层，每个Fb节点代表一个超级盒子模糊集。Fa和Fb节点之间的连接是最小和最大点，它们存储在2个矩阵V和W中，而隶属函数是Fb的传递函数[2]。第三，Fc是输出层，其节点数等于输出类数。

图1 FMMN网络结构

FMMN学习算法包括3个过程，即超盒扩展、超盒重叠测试和超盒压缩[11]。在FMMN是通过使用一组数据样本Ah来进行学习的，其中h=1…N，N是训练样本的总个数。根据训练样本，FMMN逐步创建许多超盒。每个超盒由单元超立方体(In)中n维空间中的一组最小和最大点表示。每个超盒模糊集定义为[5]：

Bj={Ah，Vj，Wj，f(Ah，Vj，Wj)}，∀Ah∈In

(1)

式中：Bj是超框模糊集；Ah=(ah1，ah2,…,ahn)是输入数据；Vj=(vj1，vj2， …，vjn)和Wj=(wj1，wj2，…，wjn)分别是Bj的最小值和最大值。

当训练数据样本包含在超盒中时，则该数据样本具有该超盒的完全隶属度。超盒的大小由扩展系数控制，扩展系数的大小为θ∈[0，1]。每个Fc节点代表一个类别，Fc节点的输出代表Ah在输出类别k中的适合程度。Fb和Fc节点之间的连接是二进制值来表示。

1.1.1隶属度函数

当提供新的训练样本时，FMMN使用隶属度函数，其取值范围为0～1，用于表示样本相对于超盒的拟合度，查找最匹配的超盒。隶属度函数使用式(2) 计算[2]：

max(0，1-max(0，γmin(1，vji-ahi)))]

(2)

式中：Bj表示第j个超盒；Ah=(ah1，ah2，…，ahn)∈In是第h个输入样本，并且γ是一个灵敏度参数，用于调节隶属函数随着Ah与Bj之间的距离增加而减小的速度。

1.1.2扩展规则

在训练阶段，执行超盒扩展过程以将输入数据包括在各自的超盒中。当超盒Bj扩展为包括输入模式Ah时，必须满足以下约束[2]：

(3)

如果输入数据不属于任何超盒，即不满足式(3)中的约束，则创建了一个新的超盒以便输入数据被网络学习。如果输入数据满足式(3)中的扩展要求，则通过式(4)更新该超盒。公式如下：

(4)

1.1.3重叠测试

重叠测试是确定是否有不同类别的重叠的超盒。由于扩展过程中可能会导致现有超盒之间存在重叠的情况，所以需要通过测试来确定是否存在重叠。这个测试主要考虑以下4种情况[2]。如果满足其中任意一个情况，就认为超盒之间存在重叠。

情况1：

Vji

(5)

情况2：

Vki

(6)

情况3：

Vji

min(min(Wki-Vji，Wji-Vki)，δold)

(7)

情况4：

Vki

min(min(Wji-Vki，Wki-Vji)，δold)

(8)

最初假定δold=1。如果δold-δnew>0，则Δ=i&δold=δnew。这表明重叠检测到第一个维度，测试继续进行下一个维度。如果不存在其他重叠区域，则测试停止，并通过设置Δ=-1，即将下一个收缩步骤表示为“不必要”[12]。注意，相同类别的超盒可以存在重叠。

1.1.4收缩规则

如果来自不同类别的超盒存在重叠，则会启动超级框收缩过程以消除重叠的区域。在收缩过程中，通过仅调整每个重叠的超级盒中n个维度中的一个维度来保持超级盒尺寸尽可能大。即，通过最小化调整每个超级框来消除重叠区域。

1.2 增强的模糊最小最大神经网络(EFMMN)

增强的模糊最小最大神经网络主要在扩展规则、重叠测试以及收缩方面进行了改进。

在扩展规则方面，为了解决现有FMMN扩展过程中可能会导致后续过程中的不同类的超盒超范围扩展这一难题[13]。Mohammed 等[4]提出如下的新扩展规则：

maxn(Wji，Ahi)-minn(Vji，Ahi)≤θ

(9)

根据式(9)，第j个超级框的每个维度都经过独立测试，以调节其是否超过扩展系数(θ)。当所有超盒尺寸不超过θ时使用扩展。

在重叠测试和收缩方面，在超盒重叠测试期间，使用FMMN模型中给出的当前4种情况不足以识别整个覆盖范围。为了解决此难题，Mohammed 等[4]进一步完善了重叠测试的情况，将重叠测试和收缩由4种情况修改为如下的9种情况：

情况1：

Vji

δnew=min(Wji-Vki，δold)

(10)

情况2：

Vki

δnew=min(Wki-Vji，δold)

(11)

情况3：

Vji=Vki