产品性能关联下绿色设计知识表达及获取方法

2022-11-25 06:28柯庆镝孙伯骜陈鹏飞
中国机械工程 2022年22期
关键词:词典关联性能

柯庆镝 孙伯骜 薛 冰 张 雷 陈鹏飞

1.合肥工业大学机械工程学院,合肥,230009 2.江苏徐工工程机械研究院有限公司,徐州,221004

0 引言

随着制造业发展和资源环境压力的增加,产品绿色设计需求被频繁提出,为满足绿色设计需求,对复杂的、多学科交叉且离散的机电产品绿色设计知识进行搜集,并基于搜集的绿色设计知识开展绿色设计知识表达以及获取技术研究,是机电产品全生命周期绿色设计的重要发展方向。

设计知识表达是知识获取、知识挖掘及知识存储的前提,是开展绿色设计知识有效支持的基础,目前有许多学者对知识表达的相关问题进行了研究。SPOLADORE[1]所提出的语义框架能够表示电器的能耗和智能家居的能源状况。QI等[2]提出了基于本体的城市热岛缓解策略知识表示,可支持城市热岛缓解的绩效评估和政府决策。吉祥[3]针对绿色设计知识建立了知识多维空间模型、内容模型和绿色产品集成模型。袁明明[4]提出了隐性知识教学的知识表达模型,给出新型知识表达模型的数学描述和概念化描述。刘宁静等[5]通过分析学术名人资源特征和用户使用需求,构建学术名人描述框架模型和学术名人与其他实体关系模型。SEQUEDA等[6]提出一个以映射模式为中心的表达框架。时元勋[7]提出一种扩展与或树结构模型来表达变型产品的产品结构。高劲松等[8]面向文物图像资源底层视觉特征与高层语义特征的精细化映射与细粒度知识表示进行了相关研究。左毅等[9]运用高阶的知识表示等知识工程理论与方法梳理出军事领域适用的知识表达方式。NASR等[10]分析能源安全计量领域的知识状况,设计出能源安全领域的知识图谱。郭鑫等[11]提出基于目标的工艺设计知识构成要素建立工艺设计知识组织模型。李慧清[12]在归纳现有机械类产品设计知识的基础上提出基于本体的知识表达。刘琦等[13]分析了中医药领域的知识表示技术及推理方法。陈文杰[14]采用基于主题模型和变分自编器的关系向量构建方法,根据关系上的主题分布信息将同一关系表示为不同的实值向量,从而实现向量不同维权重的自适应赋值。胡韧奋等[15]提出一种基于深层语言模型(BERT)的古汉语知识表示方法,能充分利用上下文信息,实现语序、语法、语义、语境等信息的编码。蒋勋等[16]构建了突发事件演化知识表示模型。王毅等[17]在分析改模知识的基础上提出一种基于本体的多层知识表达与推理模型。

在知识获取方面,基于知识表达的知识获取可为构建知识库提供数据支撑。SHU等[18]提出一种增量知识获取算法。JIANG等[19]提出一种新的注意力增强联合学习框架,该框架可以针对移动互联网应用场景进行分散式知识获取。BORIS[20]提出一种具有动态用户需求的用户知识获取方法,利用自然语言处理技术将文本表单解决方案转化为数据。WU等[21]提出一种用于构建多级流模型的知识获取和表示程序,提高了整体模型的质量和一致性。JOHNSON[22]研究了以可持续性为导向的中小企业获取和开发环境管理体系和相关工具所需的明确知识。SASIDHARAN[23]根据用户的领域专业知识将知识网络重新概念化为子网,并分析具有不同性能结果的工作组之间子网之间的知识获取模式。REYES等[24]提出一种新的互动方法,用于适应知识的获取和重用。王然[25]在粗糙集理论的基础上提出一种面向用户偏好的突发事件知识获取方法。王仲等[26]提出一个知识获取、表达与推理的系统性框架。石玉鑫等[27]提出一种领域基础词典的构建方法。

综上所述,目前设计知识主要聚焦于材料选择、结构设计、工艺设计、制造等的某一个阶段,但从全生命周期角度出发,分析并获取机电产品的绿色设计知识相关研究报道较少,无法有效支撑产品全生命周期下的绿色设计,进而解决产品内部设计参数与其多种绿色性能之间的关联问题。因此,通过分析全生命周期产品绿色性能,进而构建知识表达并获取绿色设计知识,是当前需要解决的技术问题。针对上述问题,本文提出OPP结构树,基于全生命周期建立操作结构树、产品结构树、性能结构树及其之间的多关联关系,构建基于关联关系的绿色设计知识表达,并基于绿色设计知识表达来获取绿色设计知识,最后以液压阀为例,验证绿色设计知识表达和获取方法的有效性。

1 面向生命周期绿色性能的知识表达

绿色设计知识是产品绿色设计过程中产生的,是对产品全生命周期设计及其关联绿色性能的有效分析、概括和展示[28-29]。

面对设计知识隐性离散的特点以及绿色设计的需求,基于物元理论,本文提出了操作元素、产品元素(产品元素可细分为结构元素和材料元素)和性能元素。其中,设计知识需要有操作动作来表示设计过程,因此提出操作元素来表示改变对象的动作;设计知识是以产品为中心并为研发人员设计产品服务,所以设计知识中应该包含产品元素,且产品元素是主体对象、主要设计内容;设计知识的绿色度和作用是通过操作所产生的性能来衡量的,因此提出性能元素来表征操作的目标值。

操作元素、产品元素和性能元素三者之间的关联关系如图1所示,可表示为

图1 元素关联关系

I={O,P,F}

(1)

式中,O为操作元素,P为产品元素,F为性能元素。

该关联关系的含义为:产品元素(P)在操作元素(O)的实施后到达了性能元素(F),其中,O-P关联关系描述操作某个对象的过程,以及该操作过程的可行性程度;P-F关联关系描述产品对象产生性能变化的过程,以及该性能变化的程度,这种关联关系可能是多维的,即产品元素在操作元素实施之后可到达多种性能元素。

综上所述,本文所提出的设计知识主要是基于OPP的设计信息(操作元素、产品元素和性能元素)的映射关系,是用于帮助设计人员在不同设计场景下实现绿色设计目的的信息。

为提高知识应用的准确度,在构建知识表达时,将元素分类并构建结构树。操作结构树反映设计的动作,是对操作元素的细分;产品结构树包含的是产品元素,反映了各部件之间关系;性能结构树反映了设计操作对环境输出作用的效果,是对性能元素的细分。

结构树间的互相关联可将一条知识完整地表达出来(图2),同时引入多粒度分类,实现多情境任务需求下准确检索解决方案的功能。

图2 绿色设计知识表达

(1)操作结构树。针对不同的领域、不同设计阶段专利文档的多样性和复杂性,建立结构树的节点元素,以精确定位操作元素和产品元素的关联关系。因此,基于产品设计流程考虑,将操作划分为材料选择、结构设计、工艺设计三个维度,如图3所示,可表述为

图3 操作结构树

O={O1,O2,O3}

(2)

式中,O、Oi(i=1,2,3)分别为操作结构树的第一层、第二层元素。

为规范表达,通过搜集机电产品领域相关专利,不断完善和总结,建立了面向机电产品的操作标准集,见表1。

表1 操作标准集

通过构建操作结构树可规范表达文本中的操作相关元素,便于存储到数据库中,且根据生命周期阶段对操作进行分类,可满足不同设计阶段的需求。

(2)产品结构树。产品信息具有动态性、模糊性和多样性,将产品元素逐层分级,形成的产品结构树如图4所示,子层次是零件级,零件的形成需要经过材料选择和结构设计这两个阶段,可表示为

图4 产品结构树

P={P1,P2,…,Pi,…,Pn}

(3)

(4)

产品标准集见表2。

表2 产品标准集

产品结构树将产品分层进行表达,多层次细粒度的划分可增加关联关系,提高绿色设计知识的准确度和细粒度,满足设计人员在全生命周期不同阶段的各种设计需求,提高知识重用度和产品再设计的效率。

(3)性能结构树。基于产品全生命周期将性能划分为原材料获取阶段、制造与装配阶段、运输阶段、使用阶段和回收处理阶段,性能结构树如图5所示,可表示为

图5 性能结构树

F={F1,F2,…,F5}

(5)

式中,F、Fi(i=1,2,3,4,5)分别为操作结构树的第一层、第二层元素。

为规范操作,通过搜集机电产品领域相关专利,不断完善和总结,基于GB/T32161—2015《生态设计产品评价通则》[30]提出了相关的生命周期性能标准集,见表3。

表3 性能标准集

性能结构树中的绿色性能满足设计人员直接的绿色设计知识需求,污染性能帮助提高设计效率。

构建的三个结构树单独作用是没有意义的,结构树间的互相关联才能将一条知识完整地表达

出来,本文采用五元组的方法将结构树间的关联关系表达出来,形成完整的知识表达。操作对象通常是材料和结构,会产生绿色性能和污染性能,绿色设计知识可以表示为

(6)

2 基于OPP领域词典的绿色设计知识获取方法

2.1 OPP领域词典的构建

本文从专利及文献中抽取出名词、动词、动词短语,采用专家标注,构建OPP(操作、产品、性能)领域词典,如图6所示。传统标注面对大文本量时,由于关键字多,直接应用效果不佳,故本文结合OPP结构树对每个词典进行细粒度划分。进行标注时,利用前文制定的标准集指导标注,标注示例见表4。

表4 标注示例

图6 OPP词典构建流程

在文本中,操作元素、产品元素多是单个词汇,可直接录入词典。性能元素较复杂,可以是词汇和动词短语,为减少词典的数据量,将性能短语标准化,即建立性能短语与性能标准集映射关系,如“提高加工精度”和“减少阀体的质量”可以标准化为“高加工性”和“轻量化”,表示为

WFi→fi

(7)

式中,WFi为结构树对象fi所对应的词组、短语集合,i=1,2,…。

为提高标准化的效率,采用同义词林辅助标准化,如图7所示,并将标准化过程中的映射关系存入性能词典中。

图7 同义词林辅助标准化示例

标准化的过程是通过从标准库中匹配语义相近的元素来代替短语,通过专家标注两者之间的联系,计算机可以识别文本中的短语,并给其贴上元素标签。为减少标注工作量,基于同义词林进行相似度分析,从中匹配短语各部分同义词,相互组合使得多个语义相近的短语用同一个元素标签代替。图7中,在标注“减小质量”为轻量化过程中,系统可以自动将“降低重量”“减轻重量”等标注为“轻量化”。基于上述同义词间的相互组合进行的标注示例优化见表5。

表5 标注优化

2.2 绿色设计知识获取

通过领域词典提取的词汇是相互独立的,不存在关联关系,不能完整地表达绿色设计知识,例如,通过操作词典识别出“电泳漆”、通过产品词典识别出“硬铬”、通过性能词典识别出“轻量化”,被提取的三个词汇没有建立关联关系,无法挖掘出“电泳漆-硬铬-轻量化”的知识。因此,提出基于OPP领域词典的绿色设计知识获取方法,通过领域词典识别并获取文本中的关键字,形成操作集、产品集和性能集,并从统计学的角度建立不同集合中元素之间的关联关系,形成绿色设计知识,具体过程如图8所示。

图8 绿色设计知识获取流程

对挖掘的关键字进行分析,通过计算点互信息(pointwise mutual information,PMI)[31]来衡量三个词典提取的词汇之间的关联程度,从而抽取出关联程度较高的词汇组合。PMI从统计学的角度来衡量词语之间的语义关联程度,针对某文本集合Ti中的词汇O、P、F,若这三个词汇出现在同一个文本当中,则称词汇O、P和F共现,共现的概率可表示为

(8)

式中,f(O,P,F)为O、P和F共现的数量;|Ti|为参与计算的文献文本数量。

O、P、F单独出现的概率为

(9)

式中,f(O)、f(P)、f(P)分别为O、P和F出现的频率;C1、C2、C3分别为操作集、产品集、性能集总的元素个数。

O、P和F关联程度计算公式为

(10)

PMIg(O,P,F)表示操作元素、结构元素、绿色性能元素间的点互信息,当其大于阈值时,认为集合Ti中O、P和F具有搭配关系,并且{O,P,F}代表提取的绿色设计知识。则操作元素、结构元素、污染性能元素间的点互信息为

(11)

当PMIng(O,P,-F)大于阈值时,{O,P,-F}表示提取的污染设计知识。

考虑到同一个O-P可能会导致绿色性能和污染性能,污染性能较绿色性能多的P-F关联关系参考价值低,需要对建立的关联关系进行筛选,确保知识的可用性,通过引入绿色关联度来衡量知识的可用性。

计算绿色关联度的公式为

(12)

式中,L为知识中各元素的绿色关联度;Fi为该操作下的绿色性能;(-F)i为该操作下的污染性能。

通过式(12)可得到三种结构树元素的绿色关联度L,若达到阈值G0,例如,3D打印液压阀-支撑,产生两个绿色性能:节能、轻量化;一个污染性能:成本高,计算的绿色度大于阈值,那么3D打印液压阀-支撑-性能的关联规则是可用的。

在绿色设计知识表达的基础上,考虑机电产品全生命周期设计信息,设计绿色设计知识在数据库的存储方式:操作层-产品层-性能层,如图9所示。

图9 绿色设计知识存储方式

将数据库中表格分为三层:操作、产品、性能。每个层次都包含不同类型的表格,通过层间关联和交互实现绿色设计知识集的存储,来支持产品全生命周期绿色设计。

该存储方式可重复利用各层次的元素,即元素间的不同关联关系形成一条绿色设计知识,可实现少量元素表达大量绿色设计知识的目的,提高了知识的存储效率。

3 应用实例

3.1 实验数据集

本文选取液压阀作为分析对象,首先从400篇液压阀相关专利和论文中针对性地搜集操作动词、产品名词和性能词汇(词组),构建操作词典、产品词典和性能词典,然后用另外1000篇摘要进行操作-产品-性能关联关系挖掘实验,实验过程中,基于操作词典匹配识别出C1=1127个操作关键字,产品词典匹配识别出C2=2178个产品关键字,性能词典匹配识别出C2=854个性能短语、词组,并标准化。

3.2 关联关系的确定

设置PMI的阈值为3.3,得到部分关联关系见表6,对应的操作、产品和性能关键字数据见表7~表9。

表6 部分关键字关联关系统计

表7 操作关键字(O)

表8 产品关键字(P)

表9 性能关键词(±Fg)

表6中,Na指的是空值。将PMIg和PMIng代入式(12),可以得到关联关系的绿色度:L1=9.3913,L2=8.2980,L3=0.1333,L4=-6.4958,L5=16.0920,L6=5.6978,L7=7.3696,L8=4.0260,L9=6.0699,L10=-4.5237,L11=3.9545。设置绿色度的阈值G0为0,则L4和L10因小于阈值而被删除,其余知识因绿色关联度大于0,因此可用性较高。将筛选后的元素及其之间的关联关系基于图2构建的知识表达进行存储(图10),其中,因液压阀属于结构简单的产品,所以本案例中的产品结构树从零件级开始分类,由图10的知识表达能够得到绿色设计知识集的数学描述K:

图10 3D打印液压阀绿色设计知识表达

K=

(13)

由式(13)可知:3D打印悬臂制造成本低、加工能耗低、阀体易变形;机加工支撑易拆卸、可制造性好、热辐射低;去除工艺孔降低故障点;使用管网结构在使用过程中节能、提高整体性能;结构优化交叉钻孔系可以减少压降;拓扑优化流道可以轻量化液压阀。针对不同的设计需求,绿色设计知识集中可找到与之对应的绿色设计知识。例如,面对“减小液压阀的重量”需求,可确定设计对象是液压阀,绿色性能是轻量化,即可在绿色设计知识集中确定对应的操作:拓扑优化,最终匹配到对应的绿色设计知识“拓扑优化液压阀流道可以轻量化液压阀”,具体应用见表10。

表10 绿色设计知识的应用

4 结论

(1)本文统计分析机电产品设计资源及基本信息,分析三类主体元素(操作-产品-性能)的关联过程,提出面向生命周期下绿色设计需求的绿色设计知识表达,实现了设计对象、设计过程与其绿色性能的有效关联。

(2)利用专家标注结合同义词林构建操作词典、产品词典和性能词典,利用词典对摘要文本中的关键词进行识别匹配,得到操作集、产品集和性能集;通过计算集合中元素间的点互信息PMI,建立元素间的关联关系,最后通过计算绿色关联度筛选出绿色设计知识。

(3)以某款液压阀结构设计为例,搜集并处理液压阀相关专利,通过绿色性能分析得到知识元素如下:3D打印、选区激光熔化、机加工结构优化、拓扑优化、悬臂、液压阀、支撑、工艺孔、管网结构、流道、交叉钻孔系、寿命低、可拆卸、寿命高、低热辐射、可制造性好、质量高、使用节能、高性能、压降低等。形成绿色设计知识集合,可应对“降低液压阀的使用能耗”“减小液压阀的压降”“减小液压阀的重量”等需求。综上,这种知识结构具有表达清晰、便于推送的优点,可有效满足产品设计过程中的各种绿色设计需求。

(4)本文方法可用于专利等文献中绿色设计知识表达的构建和绿色设计知识的获取,在构建OPP词典时,由于本文方法需要大量的标注,属于有监督学习,需要耗费大量的人力物力,故今后需要在无监督学习构建词典方面开展深入研究,进一步推动机电产品全生命周期绿色设计。

猜你喜欢
词典关联性能
夏季五招提高种鹅繁殖性能
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
保暖袜透湿性能测定的不确定度分析
米兰·昆德拉的A-Z词典(节选)
米沃什词典
“一带一路”递进,关联民生更紧
提供将近80 Gbps的带宽性能 DisplayPort 2.0正式发布
词典引发的政治辩论由来已久 精读
奇趣搭配
智趣