核模糊聚类和BP神经网络的切削工艺绿色度评价

2018-11-12 08:04王宇钢修世超
机械设计与制造 2018年11期
关键词:训练样本聚类神经网络

王宇钢,修世超

1 引言

切削加工采用刀具从工件上切除多余材料,是机械加工领域中应用最广泛的制造工艺技术之一。在切削加工过程中,切削刀具的磨损,能源及材料的消耗,特别是为降低切削温度而大量使用的切削液和产生的切屑等难以处理,会对环境及人体产生极大危害。并且随着我国环保法规的健全,切削废液及排放废物的回收处理成本将进一步增加,加工的高能耗、高成本将加重制造企业的经济负担[1-2]。因此,对切削工艺过程进行绿色特性分析和评价,开发科学合理的切削工艺绿色度评价方法具有重要意义。

目前应用较多的工艺绿色度评价方法有模糊综合评价法、生命周期评价法和层次分析法等。文献[3]采用模糊集理论以及决策试验与评价实验室(Decision making trial and evaluation laboratory,DEMATEL)方法,建立绿色工艺评估因子关联影响矩阵,研究绿色工艺参数决策影响因素,并在电火花加工的工艺参数决策中进行应用验证。文献[4]针对制造过程对环境的影响,提出一种基于动态生命周期的评价方法。该方法通过构建一个动态的资源消耗和废物排放网络目录,改善生命周期评价方法数据的准确性和质量。文献[5]采用模糊层次分析法(fuzzy analytic hierarchy process,FAHP)建立了一种两级结构的多目标机械加工工艺优选模型,从加工时间、加工成本、加工质量和环境影响四个优化目标综合考查机械加工工艺方案,并应用于航空于叶片的工艺方案优选。由于绿色工艺评价是一个具有高度非线性和复杂难以精确度量的系统,传统的评价方法对评价指标间的相互影响未加考虑,难以客观构建评价指标与评价结果间的函数关系,且评价过程繁琐,规则难以理解[6]。

针对工艺绿色度的评价问题,提出了一种基于核模糊聚类和BP神经网络的评价模型。该评价方法利用BP神经网络的非线性函数逼近性能客服传统评价方法不足,通过核模糊聚类算法对样本数据集进行模糊划分,基于聚类结果训练BP神经网络并获取模糊映射规则,从而构建BP神经网络评价模型,通过实例验证了评价方法的有效性。

2 评价指标体系的建立

工艺绿色度评价涉及机械、材料、环境及经济等若干学科,是一个多因素、多层次的综合评价问题。影响工艺绿色度的指标有很多,既有可以直接采集的定量指标,也有存在模糊性的定性指标[7]。按照面向绿色制造的工艺规划方法,构建了两层评价指标体系。第一层为共性指标层,根据评价准则和影响因素分为若干共性指标类;第二层为具体指标层,表示切削工艺绿色度有关的具体评价指标,选取10个极小型指标(值越小绿色度越好)作为评价模型的输入项。建立的绿色度评价指标体系,如表1所示。

表1 切削工艺评价指标Tab.1 Cutting Process Evaluation Indexes

由表1可知,在指标量化时可分为无法用数值计量(十分制打分的方法)的定性指标和直接采用测量值得到的定量指标。为正确反映各指标数据的可比性,便于进行评价分析,采用小数定标数据归一化处理方法,使指标值均处在(0,1)之间,将指标原始值x归一化为x′的计算方法,如式(1)所示。

式中:j—小数点移动位数,等于指标取值中的最大绝对值整位数。

3 核模糊聚类和BP神经网络的绿色度评价方法

3.1 评价方法原理

BP神经网络算法具有大规模并行处理和自组织学习能力,可以逼近任意的非线性映射关系。将BP神经网络应用于复杂的评价问题,可简化繁琐的评价过程,提高计算的效率和精度。在应用神经网络解决评价问题时,须有高质量的训练样本集供算法进行学习。由于样本数据的模糊性和复杂性,凭借经验人为划分样本主观性大,易产生较大偏差。因此应该对工艺样本进行聚类分析,获得合理科学的训练样本集,为应用BP神经网络评价提供决策依据。

评价方法原理为:对归一化的工艺数据样本采用核模糊聚类算法进行分类,并为每类样本指定期望值,构造出优化的评价训练样本集;将训练样本作为评价模型的输入训练BP神经网络;通过自适应学习调整网络权值,评价模型自动生成符合用户需要的输入-输出映射规则;BP神经网络模型的输出量即为评价结果。评价模型原理,如图1所示。

图1 评价模型原理图Fig.1 Evaluation Model Schematic Diagram

3.2 核模糊聚类算法

模糊C-均值聚类算法(fuzzy C-means clustering,FCM)是目前应用最广泛的一种模糊聚类算法[8]。其原理是:首先定义一个准则函数,并人为规定C个初始聚类中心,然后根据样本与聚类中心的距离,将该样本划分到该类中,再重新计算每个类的聚类中心和每一个样本的模糊隶属度。此过程不断重复,直到准则函数最小。在解决具有复杂的非线性和高维性问题时,核模糊C-均值聚类(Kernel Fuzzy C-Means Clustering,简称KFCM)算法具有很大优势[9]。基于核函数的聚类基本思想就是:通过核函数构造新的特征向量,将输入空间映射到高维特征空间,使得在输入空间中线性不可分的样本变为线性可分,最后在高维特征空间中实现聚类[10]。

设 n 个 P 维数据样本集合 X={x1,…xn}∈RP,分为 C 类,通过函数Φ把所有样本映射到高维特征空间Q中,得到Φ(x1),Φ(x2),…,Φ(xn),并在特征空间Q中进行聚类。由核函数定义,高维样本空间中核函数K(x,y)可以用原空间的点积运算来表示,即 K(x,y)=Φ(x)TΦ(y),且满足 Carchy-Schwarz不等式和对称性。在特征空间Q中,核模糊C-均值聚类算法的目标函数可表示为:

式中:U—模糊隶属度矩阵;uik—第k个样本属于第i类的隶属度;V—聚类中心;vi—第 i个聚类中心;xk—第 k个样本;m—加权指数,且 m>1; Φ(xk)-Φ(vi)2—核空间中第j个样本到第i个聚类中心的距离,可表示为:

取高斯核函数时,K(x,y)=exp(- x-y2/σ2),σ2为常数,则 K(x,x)=1。则式(2)改写为:

以(4)式取最小值为优化条件,相应的样本隶属度函数和聚类中心表达式分别如式(5)和式(6)所示。

3.3 聚类算法仿真

为了验证核模糊聚类算法的性能,选择来自机器学习数据库UCI的2个真实数据集iris和wine进行实验。其中,iris数据集有4维样本150个,分为3类,每类包含50个样本。wine数据集有13维样本178个,分为3类,各含59,71,48个样本。实验条件为:误差ε=1e-6,最大迭代次数Tmax=100,模糊指数m=2.0,高斯核函数参数180。基于2个数据集分别对2种算法进行5次仿真运算,取各指标的平均值,如表2所示。

表2 数据集的聚类结果Tab.2 Clustering Results of Data Sets

由表可知KFCM算法比FCM算法在聚类正确率和聚类速度方面均表现良好,具有较好的聚类分析能力。

3.4 BP神经网络

BP神经网络采用梯度搜索算法修改各层神经元的连接权值,学习并获取输入到输出间的映射规则,使得给定输入值时得到最接近期望输出的结果。BP神经网络一般由输入层、隐含层和输出层三部分组成。采用多输入单输出结构。输入层节点为用于评价的指标值,根据表1选取10个切削工艺绿色度指标作为输入量。输出层节点为1个,输出值即为评价值。BP神经网络隐含层可以是一层或多层,评价模型选择单隐含层网络结构,节点的个数可采由经验公式或逐步试验法确定,选取6个节点。网络的相应激活函数为Sigmoid函数,即:

所述的BP神经网络结构,如图2所示。

图2 BP神经网络结构Fig.2 BP Neural Network Structure

4 应用实例

4.1 样本的确定

实例数据采集自某汽车企业制造零件的切削加工工艺。按照表1提取样本数据,经归一化处理后样本量化值,如表3所示。

4.2 样本的分类

采用核模糊聚类算法聚类分析,聚类数设为3,得到样本各类别聚类中心V为:

在实际应用中,为满足用户或专家的需要可为样本指标赋予权重。采用专家咨询方式,按十分制赋值,根据10位专家打分去平均值获得主观权重矩阵B。

B=[0.15 0.15 0.15 0.41 0.20 0.05 0.05 0.05 0.05 0.05]

将聚类中心向量和主观权重向量的转置相乘,得到各个类别的判别值如式(8):

表3 切削工艺样本量化值Tab.3 Quantized Values of Cutting Process Samples

计算结果中第三类的判别值最小,所以绿色度最好(指标系统为极小型指标),第二类判别值最大,所以绿色度最差,第一类的判别值居中。根据聚类分组个数将评价结果分级,期望值y确定方法如下:评价结果为“优”时,系统输出期望值设置为0.2;评价结果为“良”时,系统输出期望值设置为0.5;评价结果为“差”时,系统输出期望值设置为0.8。聚类结果,如表4所示。

表4 样本聚类结果Tab.4 Clustering Result of Samples

4.3 评价方法测试

建立BP神经网络评价模型,评价系统初始化参数设置如下:最大训练次数为200,学习率为0.02,模糊加权指数为2,聚类数为3,终止误差0.001。序号1-15的样本作为训练样本,序号16-20的样本作为测试样本,将测试样本的评价结果与样本的期望值对比可反映评价系统的有效性。

对评价模型进行训练,训练样本的均方根误差随迭代次数的变化曲线,如图3所示。由图3可知,当训练进行到第87步时,均方根误差明显减小,且收敛速度较快。

图3 训练样本均方根误差变化曲线Fig.3 Curves of Root Mean Square Error of Training Samples

测试样本实际值与期望值分布,如图4所示。由图4可知,评价模型输出实际值与期望值之间误差教小,数值分布基本一致。仿真结果表明此模型可以很好地应用于切削工艺绿色度评价,且评价结果精度较高。

图4 检测样本实际值和期望值Fig.4 Actual Values and Expected Values of Test Samples

5 结论

提出一种对切削工艺绿色度分析和预测的新方法,选取10个有代表性的绿色切削工艺指标,通过核模糊聚类算法建立评价训练样本集,同时建立多输入单输出BP神经网络,经训练样本集训练,BP神经网络自动生成从输入到输出的映射规则,得到可用于切削工艺绿色度评价的模型。经实际切削工艺样本检验,结果表明该模型可以有效进行评价。

猜你喜欢
训练样本聚类神经网络
人工智能
神经网络抑制无线通信干扰探究
基于K-means聚类的车-地无线通信场强研究
基于神经网络的中小学生情感分析
基于高斯混合聚类的阵列干涉SAR三维成像
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
基于Spark平台的K-means聚类算法改进及并行化实现
基于神经网络的拉矫机控制模型建立
基于改进的遗传算法的模糊聚类算法