设备备件重复库存自动处理算法的应用与研究

2021-12-20 06:39余兴武郑大元韩鹏杨明川
中国设备工程 2021年22期
关键词:字符串备件字符

余兴武,郑大元,韩鹏,杨明川

(北京奔驰汽车有限公司,北京 100176)

备件仓储管理是指对备件进行的计划、实施、考核的管理,备件管理为了保证生产过程连续均衡地进行,做好备件的采购、供应、存储、合理使用等工作;备件仓储管理是对仓储物资的入库、出库、结存等活动的切实有效控制。为了满足备件仓储的科学管理,越来越多企业引入了信息化ERP管理系统,然而备件仓储系统主数据普遍存在料账不准确、重复备件等问题,严重影响备件采购决策,甚至造成呆料与缺料停工损失。

在理想情况下,不同备件应该有不同的型号和订货号;同一种备件必须使用统一的备件信息。但由于实际工作的多变性和备件信息管理的不规范性,导致很多重复备件产生。

如何查找匹配出备件数据的重复特征是实现ERP管理系统备件主数据准确而无重复的关键技术。

1 重复备件研究背景

1.1 重复备件特征

根据MRP Controller(物料管理控制员)以及库房管理人员对备件仓储管理的工作总结,备件的属性标识主要由型号和订货号,大致总结了以下重复备件的可能性。

(1)型号和订货号一样,但分配的物料号不一样。

(2)型号和订货号填写不规范,可能是包含关系,如两个备件型号分别是6005-2RSH和SKF:6005-2RSH。

(3)型号和订货号使用符号不统一,如6005-2RSH和6005/2RSH,有可能存在“-”“/”“_”等混用的情况,但主体内容一样。

1.2 重复备件数据匹配算法研究现状

相似度查询是计算机学科中的一个重要问题,它的应用遍及多个领域,例如,数据库、数据集成、互联网、数据挖掘等。林学民、王炜利用集合和字符串进行分析和归类,研究数据的重复特征的关键算法;李星毅等研讨的数据集合中相似重复记录匹配算法,通过设置不同字段不同的权值,分组重复多次计算各个关键字段的相似度,可以有效解决相似重复记录数据的问题;姜华、韩安琪等提出了一种改进的编辑距离相似度算法,解决了编辑距离标准算法在求解相似度过程中只考虑编辑操作次数,未考虑字符串包含关系对重复度匹配结果的影响,实现字符串重复相似度计算的高准确性。

根据重复备件的特征,总结前人研究成果,本文提出一种基于编辑距离相似度和字符相似度算法相结合匹配算法,可以准确而迅速得找出系统中重复备件数据,保证ERP系统中备件主数据的准确性,优化备件存储结构,降低备件采购成本。

2 编辑距离相似度和字符相似度算法

2.1 编辑距离相似度算法

编辑距离:两个字符串r和s之间的编辑距离(记作ed(r,s)或ED(r,s))是通过使用三种编辑操作形式,删除、插入或者替换单个字符,将字符串r转化为字符串s的所需要的最少编辑操作个数。如果字符串r和s的编辑距离越大,说明字符串r和s越不相似,反之相反。

标准化编辑距离:字符串r和字符串s的标准化编辑距离sed公式如下,sed的取值范围为[0,1]:

计算两个字符串r和s的编辑距离相似度,采用标准编辑距离动态规划计算方法,时间复杂度为O(|r|*|s|),空间复杂度为O(min(|r|,|s|))。

建立|r|+1行|s|+1列的矩阵D,计算两个字符串之间的编辑距离,其中初始化D[i][0]=i,0≤i≤|r|,D[0][j]=j,0≤j≤|s|,然后我们可以迭代计算D[i][j],1≤i≤|r|,0≤j≤|s|,按照下边公式:

其 中,如 果r[i]=s[j],δ=0;否 则δ=1。最 终D[|r|][|s|]为字符串r和s之间的编辑距离。

2.2 字符相似度算法

由于备件主数据重复特征较复杂,标准编辑距离算法在两个字符串长度差不多的情况下效果较理想,但重复备件特征字符串常常是包含关系,字符串长度可能差异巨大,使用编辑距离相似度算法达不到相关高效高精度匹配的结果,因此引用字符相似度算法。

字符相似度:两个字符串r和s,长度分别为L1和L2,分别拆分成单个字符集合r[L1]和s[L2],定义三种字符串相似度组合:

(1)字符集合r[L1]和s[L2]每个字符元素互相包含所占百分比,字符集合r[L1]有a个包含于字符集合s[L2];字符集合s[L2]有b个包含于字符集合r[L1];相似度charSimilarRate1计算公式如下:

生理学源自于人体解剖生理学,它是将人体解剖学、生理学、组织胚胎学等科学进行有机融合、重组而形成的一门综合性学科.该学科的前沿发展很快,如何在新的条件下,在创建跨学科、多层次人体解剖生理学教学和实验课的研究与实践中进行教学改革, 就成为当下亟待解决的问题了.另外,在生理学的教学中,既要结合结构来学习功能(与组织胚胎学、解剖学的关系),还要进行正常生理功能和病理现象之间的多层次联系(与病理生理学、药理学、临床医学等之间的关联),这也是生理学课程学习中的重要问题.基于上述原因,本课程存在教与学之间各自所具有不同程度的难点.

(2)字符集合r[L1]和s[L2]每两个相邻字符元素互相包含所占百分比;字符集合r[L1]有i个两字符相邻包含于字符集合s[L2];字符集合s[L2]有j个两字符相邻包含于字符集合r[L1];相似度charSimilarRate2计算公式如下:

(3)字符集合r[L1]和s[L2]每三个相邻字符元素互相包含所占百分比;字符集合r[L1]有x个三字符相邻包含于字符集合s[L2];字符集合s[L2]有y个三字符相邻包含于字符集合r[L1];相似度charSimilarRate3计算公式如下:

通过字符相似度可以有效查询匹配出字符长度差异较大且多重包含关系,提高重复备件查询匹配的覆盖率。

3 重复备件处理系统开发

3.1 系统开发技术

系统开发采用JAVA编程语言,运用了软件工程思想、面向对象的技术来进行分析、设计和实现,系统包含软件客户端、局域网服务器和数据库三部分。系统框架如图1所示。

图1 系统框架

3.2 系统实现效果

重复备件处理系统的基本功能包括备件主数据批量存储、重复备件查询匹配算法选择、查询匹配参数设置、导出结果等。

(1)批量查询匹配重复备件,如图2所示。

图2 批量查询匹配重复备件

①选择相似度查询算法——距离相似度或字符相似度,设置相应算法的相似度百分比;

②输入批量查询型号或订货号;③批量查询匹配重复备件结果。

(2)备件主数据全自动查询匹配重复备件

备件的特征参数是型号和订货号,系统支持所有备件主数据交叉智能查询匹配重复备件功能。查询结果如图3所示。

图3 备件主数据全自动查询匹配重复备件

4 重复备件处理

4.1 重复备件处理流程

重复备件处理主要负责人是备件控制工程师和库房管理员,其流程角色和职责如图4所示。

图4 重复备件处理流程角色和职责

4.2 重复备件处理结果

通过使用编辑距离算法和字符相似度算法分析备件的重复特征,将ERP设备备件主数据重复库存率从15%降低到1%以内,处理重复备件产生的经济效益达2000万元,实现了ERP系统中备件主数据的准确性,优化了备件库存价值。

5 结语

本文对企业的ERP系统中备件主数据特征进行分析研究,使用编辑距离和字符相似度算法,开发重复备件处理系统,匹配出重复备件并批量自动处理,杜绝重复备件的产生,保证ERP系统中备件主数据的准确性,优化备件存储结构,降低备件采购成本。通过实践证明,本文所研究的重复物料查询匹配算法以及自主开发的重复物料处理系统,可以广泛应用于ERP系统重复物料处理的问题。

猜你喜欢
字符串备件字符
中材机电备件有限公司
基于文本挖掘的语词典研究
字符代表几
一种USB接口字符液晶控制器设计
基于层次分析法的汽车备件供应商选择
HBM电子称与西门子S7-200系列PLC自由口通讯
消失的殖民村庄和神秘字符
基于元动作故障树重要度计算的备件预测
基于HANA的工单备件采购联合报表的研究与实现
一种新的基于对称性的字符串相似性处理算法