基于案例推理的舰船管路破损应急决策模型研究*

2022-11-05 10:52朱玲娜浦金云
舰船电子工程 2022年9期
关键词:舰船度量学习型

朱玲娜 任 凯 浦金云

(海军工程大学动力工程学院 武汉 430033)

1 引言

进入21世纪,各国海军装备现代化进程加快,舰船作为海军海上作战主要力量,发挥着不可替代的作用。一般的舰船管路系统可简单的划分为动力管系与舰船管系[1],包括燃油管路、滑油管路、冷却水管路、淡水管路等。但由于船舱内部结构复杂、管路系统分布广泛,加之舱体内部体积狭小、作业环境恶劣,发生故障事故的情况时有发生[2],海上作业环境恶劣,长期处于高温、潮湿、易腐蚀的状态,一旦管路发生泄露,会对舰船的航行安全、船员的人身安全以及海上环境造成威胁。

我国对舰船智能损管决策技术研究起步较晚,多数处于通过建立数学模型进行定性研究的阶段[3],将智能化技术应用于舰船损管决策研究较少,目前的损管处置更多是依赖艇员经验对舰船事故进行决策。针对目前舰船损管决策所存在的主要问题,本文针对基于LPM的案例检索技术进行了研究,以舰船管路破损为例对本文所述检索模型进行验证。为舰船的损管辅助决策提供了一个新思路,且具有一定的实际意义。

2 基于伪度量的案例推理模型

2.1 基于学习型伪度量的CBR检索模型

在 CBR 经典“R5”[4]模型基础上,本文对 CBR模型进行了改进。利用基于BP神经网络的学习型伪度量代替传统的距离度量,设计了如图1所示的基于学习型伪度量的CBR检索模型。将历史案例与目标案例的特征属性表示成特征向量形式,构建案例库;随后构建匹配池,对基于BP的LPM模型进行训练;再由LPM模型检索度量出的目标案例与历史案例的相似度,通过公式得到最相似案例并给出待选决策方案;最后经过案例修正给出决策方案,并储存至案例库中。

图1 基于学习型伪度量的CBR检索模型

2.2 算法的基础

D Wang[5]基于学习型相似性度量(LSM)提出学习型伪度量(LPM),并开发了基于神经网络的LPM框架用于予以图像分类和检索。A Yan[6]基于对学习型伪度量的研究,提出一种基于案例的模式分类推理方法,将学习型伪度量取代传统的距离度量,解决了传统距离度量容易陷入距离陷阱的问题,并在案例重用阶段采用聚类方法得到最终的预测分类,但聚类需要预先匹配大量的数据并且会导致信息缺失[7],余肖生[8]在 A Yan的基础上对案例重用进行了改进,提出一个K公式:

以0为阈值,目标案例最终分类P为

2.3.5 训练BP神经网络

此方法避免了LPM-CBR算法中聚类时需要大量预训练生成数据的步骤,减少了过早定值所造成的信息损失。本文所设计的基于BP神经网络的LPM算法在K公式的基础上进行了优化,提高了算法的准确率,并能够更好地处理不平衡数据集。

2.3 算法的实现

2.3.1 案例表示

2.3.2 数据预处理

数据预处理阶段需要将数据进行统一的归一化处理,使得目标案例与历史案例的特征属性值都映射至[0,1]区间内。

3.3.2 算法准确率

由图2可知,LPM-CBR-N算法在输入不同的干扰因子后其分类准确率无较大波动,整体较为平稳,说明本算法具有一定的抗干扰能力及鲁棒性。

2.3.4 案例检索

度量空间与伪度量空间的不同之处即为:在伪度量空间内可能存在着两点不同但距离为零的情况。因此,每个度量即为一个伪度量,但并非任一伪度量空间都是度量空间。利用等价类对伪度量进行定义[9]。

针对我国深部找矿起步晚,深部矿勘查难度较大的行业现状,为了减少深部找矿工作的盲目性和风险,确保深部矿勘查工作的有效性,提高深部找矿工作的效率,争取在深部找矿领域早日取得大的突破,我们要采取以下措施来保障深部找矿工作的稳定发展。

3.3.3 运行时间比较

按照“预防为主,综合防治”的方针,坚持以“农业防治、物理防治、生物防治为主,化学防治为辅”的无害化控制原则。农药施用严格执行GB4285和GB/T8321的规定。不得施用国家明令禁止的高毒、高残留、高三致(致畸、致癌、致突变)农药及其混配农药。

1.2 抽样原则 黔东南州共有10个县(市)种植烤烟,根据其烤烟种植面积和合同户数确定每个县(市)抽样的抽样数量,具体抽样烟农的分布情况见表1。其中,镇远种植面积最大,为2 840 hm2,合同户数1 538,抽样量108个。

2.3.6 案例重用

3 性能测试

3.1 算法设计

算法验证在Conda Python3.8环境下进行,使用Sklearn和Keras框架。实验中支持向量机算法SVM及最近邻算法KNN使用Sklearn框架进行编写,LPM-CBR、LPM-CBR-K及LPM-CBR-N算法中BP神经网络部分使用Keras框架进行编写。

氧化铋是具有6种晶相的多晶型材料,其晶相包括α(单斜相),β(四方相),γ(体心立方相),δ(面心立方相),ε(斜方相)以及ω(三斜相).在通常情况下,α-Bi2O3是在室温到730°C存在的低温稳定相,δ-Bi2O3是在730°C到熔化温度存在的高温稳定相.β与γ相是δ相在降温过程中产生的亚稳相[11].在这些晶相中,δ-Bi2O3由于存在氧空位,具有通畅的离子通道,使其离子传导率远大于其他物相[12],在固态氧化物电池、氧气传感器等[11-15]领域具有潜在的应用价值.

本实验中,SVM算法中惩罚系数设为1,核参数设为rbf,gamma设为auto;KNN算法中聚类数据设为5;BP算法中设为三层网络结构,隐藏层节点数为10,激活函数设为Sigmod函数,训练函数设为Trainrp函数,batch_size=128,epoch=1200;LPM-CBR和LPM-CBR-K算法中BP部分,设置为三层网络结构,隐藏层节点数为10,激活函数设为Sigmod函数,训练函数设为Trainrp函数,batch_size=128,epoch=1200;LPM-CBR-N算法中BP部分,设置为四层网络结构,第一个输入层节点个数为输入特征属性个数,第一个隐藏层节点数为15,第二个隐藏层节点数为2,最后一层输出层节点个数为1,中间激活函数设为ReLU函数,最后一层输出层的激活函数设为Sigmod函数,batch_size=512,epoch依据不同数据集进行设置。

3.2 舰船管路破损实验集

本文收集了舰船海水管路HG、淡水管路DG、燃油管路RG以及滑油管路YG的各种常见管路破损,将其分为五大类管路失效类型:管路腐蚀、制造缺陷、施工缺陷、设备缺陷以及外力作用。具体失效类型及破损原因如表1所示,其相关特征属性如表2所示。

表1 舰船管路失效分类

表2 舰船管路失效类型的相关特征属性

收集的实验数据集如表3所示。其中,对海水管路仅进行管路腐蚀、施工缺陷、设备缺陷以及外力作用4项管路失效类型分类;对淡水管路仅进行管路腐蚀以及施工缺陷两项分类管路失效类型分类;对燃油管路仅进行制造缺陷、施工缺陷以及设备缺陷3项分类管路失效类型分类;对滑油管路仅进行管路腐蚀以及设备缺陷两项分类管路失效类型分类。

表3 实验数据集基本信息

3.3 实验结果及分析

3.3.1 鲁棒性

为检验LPM-CBR-N算法的鲁棒性,对其在输入特征属性存在噪音的情况下进行干扰测试,利用表3中的数据集进行鲁棒性测试。首先,在每一折实验时都自动生成一个随机向量,即噪音noise,服从(- 1,1)均匀分布;随后,在噪音中加入10个不同的干扰因子λi(i=1,...,10),此时LPM-CBR-N模型的输入向量s变为[I+λi× diag(noise)]s,即输入向量s与噪音noise之和,其中干扰因子λi(i=1,...,10)为1%~10%变化,I为适当维数的单位矩阵,diag(.)为对角矩阵。不同干扰因子下的模型分类准确性如图2所示。

图2 鲁棒性测试

根据比例将数据划进行划分,分为训练集Dtrain和测试集Dtest,将90%的数据集划分为训练集Dtrain,10%的数据集划分为测试集Dtest。

2.3.3 十折交叉实验

定理1给定集合X和一组等价类是从X上的等价关系~导出的,方程式式(9)是对集合X上的函数f的定义:

为验证LPM-CBR-N算法的准确率,将LPMCBR-N与SVM、KNN、BP、LPM-CBR-K几种方法进行了对比实验,表4为各算法的分类准确率。

表4 各算法的分类准确率

可以看出,LPM-CBR-N算法对大部分数据集都有较高的准确率,在数据集DG上的准确率比LPM-CBR-K算法高4.58%,在数据集RG上的准确率比LPM-CBR-K算法高4.64%,在数据集HG上的准确率比LPM-CBR-K算法高2.3%,即使在数据集RG的测试中,LPM-CBR-N算法所得的分类准确率虽略低于LPM-CBR-K算法,但两者间准确率差距较小,仅低了0.56%,说明LPM-CBR-K算法具有一定的优越性。

[17]Lazer D, Kennedy R, King G, et al., “The parable of Google Flu: traps in big data analysis”, Science, 2014, 343(6176), pp.1203-1205.

选择2017年1月—2018年1月于我院接受肝癌治疗的患者86例,采用奇偶法将其分为实验组(n=43)与参照组(n=43)。其中,男性肝癌患者61例,女性患者25例。最小年龄35周岁,最大年龄73周岁,中位年龄(51.09±10.36)周岁。两组患者年龄、性别等基线资料统计分析结果不具备明显差异(P>0.05),分组方式有可比性。纳入标准:(1)了解本研究内容,主观自愿参与本研究;(2)经病理确诊为肝癌[1]。排除标准:(1)预估存活时间少于3个月;(2)病案资料不全。

进行对比试验时,对表3内数据集依次运行SVM、KNN、BP、LPM-CBR、LPM-CBR-K 及LPM-CBR-N算法,数据集运行时间如图3所示,具体数值如表5所示。

图3 运行时间对比

表5 各算法运行时间

由实验数据可知,对同一数据集而言,LPM-CBR-N算法与SVM算法及KNN算法相比运行时间较长,但较BP算法、LPM-CBR-K算法与LPM-CBR算法而言显著的降低了运行时间;LPM-CBR-N算法运算速度略优于LPM-CBR-K算法,但运行时间差别较小。

3.3.4 不均衡数据比较

正负样本不均衡的情况在二分类数据集中时有发生。例如淡水管路数据集DG与滑油管路YG,若以单一的准确率指标作为参考,作用其实并不大。为考察LPM-CBR-N算法的综合性能,还需综合考虑查全率和查准率,查全率(TPR)主要用于表示能够算法被正确诊断出故障的案例在所有故障案例中的占比,查准率(FPR)主要用于表示被算法错误判断的正常案例在所有正常案例中的占比,两项指标的基本公式如下所示:

翠绿色独山玉的折射率为1.57[1],比重为2.9[1],摩氏硬度为5.5~6.4[1];而翠绿色的仿独山玉,在外观上与独山玉中的天蓝玉、满绿玉很相似,但其硬度略低于独山玉的正常值。为了确定这种翠绿“独山玉”,笔者对其进行了常规的宝石学检测和薄片鉴定、X射线粉末衍射分析、电子探针检测、红外光谱检测,并探讨了它的颜色成因。

查全率与查准率时一对矛盾的度量,一般而言,查准率较高时查全率往往较低,而查全率较高时查准率往往较低[12]。在对两项指标要求都较高时,实验选择F1指标衡量算法在不均衡数据上的性能,F1是查全率与查准率的调和平均,基本公式如下所示:

其次,在开展不同课堂活动的过程中,老师还可以也结合知识传授的具体规律和相关的策略不断的构建活动的意义和价值,实现翻转课堂与英语专业翻译教学之间的紧密配合,提高和培养学生良好的互助合作精神,鼓励学生通过共同协商和共同探讨的形式解决翻译过程中所存在的问题。另外老师还可以将翻转课堂与小组式的教学模式相结合,让学生在小组探讨的过程中进行合理的分工,真正地实现相互合作和共同发展。

以淡水管路数据集DG为例,以不同的正负样本比例对LPM-CBR-N算法与LPM-CBR-K算法、LPM-CBR算法进行实验测试,正负样本比例从1:4至4:1,判决结果如图4、图5所示。

图4 Acc对比图

图5 F1对比图

由实验数据可以看出,LPM-CBR-N算法能够更好地处理不平衡数据集,当正负样本比例较大时表现较LPM-CBR与LPM-CBR-K都好,LPMCBR-N算法的准确率最高,当正负样本均衡时,LPM-CBR-N算法的F1值略高于LPM-CBR与LPM-CBR-K。

根据对创业中主要困难的调查,54家样本科技型创业企业中,有75.93%的企业将融资难、融资贵列在首位,占比最高;同时有超过一半的企业认为政策支持不完善和创新创业能力不足影响企业发展。基于上述现状与问题分析,要进一步发挥众筹对科技创业的支持作用,还需强化政策支持,完善风险防控和监管措施,构建长效机制,形成协同效应,打通政策落地“最后一公里”。

4 结语

本文对基于学习型伪度量LPM的CBR检索模型进行了优化,针对案例特征属性较多、正负比例不均衡的数据集分类情况进行了改进,提出了基于LPM-CBR-K算法优化的LPM-CBR-N算法。在案例检索阶段使用伪度量代替传统的距离度量,避免了“距离陷阱”问题的出现,在案例重用阶段对K公式进行改进,避免了聚类需要重复匹配数据的缺点。最后利用来自实验数据集对本文所述LPMCBR-N算法进行了性能测试,证明算法具有一定的抗干扰能力,综合能力较其他算法更强,具有一定的优势。为案例推理技术在舰船管路破损决策上的应用提供了一定的理论基础,为舰船的损管决策方法提供了新思路。

猜你喜欢
舰船度量学习型
舰船通信中的噪声消除研究
鲍文慧《度量空间之一》
模糊度量空间的强嵌入
舰船测风传感器安装位置数值仿真
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
做学习型父母 和孩子共成长
舰船腐蚀预防与控制系统工程
地质异常的奇异性度量与隐伏源致矿异常识别
建设学习型党组织的实践与思考
创建学习型教师团队