基于农产品本体的语义检索推荐系统框架

2019-08-10 06:36郭伟光
电脑知识与技术 2019年17期
关键词:本体

郭伟光

摘要:在农产品的电子商务中,信息过载使得人们难以快速查找到最为关注的农产品信息。现在很少有基于语义网和本体技术构建的农产品知识检索与推荐系统。针对这一问题,在描述农产品本体基本结构的基础上,提出一个基于农产品本体的语义检索与推荐系统框架。系统除了能让用户使用语义查询功能直接检索农产品知识外,还能向用户推荐农产品的关联知识。

关键词:语义网;本体;语义检索;推荐;农产品电子商务;系统框架

中图分类号:G642        文献标识码:A

文章编号:1009-3044(2019)17-0191-03

开放科学(资源服务)标识码(OSID):

Abstract: In the e-commerce of agricultural products, information overload makes it difficult for people to quickly find the most important agricultural product information. Currently, there are few agricultural product knowledge retrieval and recommendation systems based on semantic web and ontology technology. Aiming at this problem, based on the description of the basic structure of agricultural products, a framework of semantic retrieval and recommendation system based on agricultural products is proposed. In addition to allowing users to directly retrieve agricultural knowledge using semantic query functions, the system also makes it possible to recommend the associated knowledge of agricultural products to users.

Key words: semantic web; ontology; semantic retrieval; e-commerce of agro-products; system framework

1 引言

近年来,我国鼓励传统农产品流通企业发展线上线下结合的网上批发和网上零售,农产品电子商务发展迅速,涉及农产品经营的电子商务网站数以万计。随着消费者对健康和食品安全问题的关注,在农产品消费时相比以往更关注农产品的营养、产地、功效、加工品、绿色安全等信息。但每个农产品电子商务网站所提供的信息量多且繁杂,导致无法让消费者快速、有效找到所需要的信息,出现所谓“信息超载”。在农产品的电子商务中,信息过载使得人们需要大量的用户交互,难以快速查找到最为期望的农产品信息。

语义网是一种智能网络,它不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以使信息检索变得更准确。基于本体的语义检索和推荐能够帮助用户不断调整自己的检索词汇,改变检索策略,以获得最为相关的知识。农产品电子商务平台和许多相关学术研究都在探讨通过语义网与信息推荐来改善信息检索效率。范顺忠,陈浩对基于用户的协同过滤算法进行改进,设计一种融合专家选择和在线推荐的菜品推荐系统,通过在候选菜品选择时引入时间敏感因子和协同过滤中引入时间遗忘因子,改进兴趣感知算法和菜品偏好预测效果,使得在推荐的准确性和效率方面有明显改进[1];秦志远等人基于农产品目录信息及农业物联网感知信息分别建立农产品上层本体和下层本体,根据消费者信息建立消费者兴趣本体, 然后将农产品上层本体与消费者兴趣本体进行概念语义相似度计算,实现个性化推荐[2]; 彭洁等人提出通过收集农产品的评价信息,进行预处理,提取出每个评价者的特征-意见值对,提出一种基于潜在类回归模型(latent-class regression model,简称LCRM)和组群偏好的个性化推荐方案[3];于超等人,在网络教育资源的检索工作中应用了本体语义的概念,提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene对扩展后的查询条件进行检索的语义检索模型[4];杨清琳等通过建立领域本体知识库,改进传统检索系统基于关键词匹配存在的缺陷,将用户输入的自然语言查询经分析推理后上升到语义层面,构建了一个基于领域本体知识库的语义检索模型,提高了检索性能[4]。

目前,在农产品电子平台中,很少有使用语义网和本体技术的实际应用,也没有专门的农产品知识查询系统。语义网环境下基于本体的知识集成能够解决不同网络信息资源的语义异构问题,通过集成不同的知识结构和不同来源的知识,为用户提供统一的知识访问接口以及智能化的知识服务[5]。本文基于语义网技术,通过农产品知识本体的运用,提出一个基于农产品本体的语义检索和推荐框架,希望能改进对用户输入检索语句的理解,减少用户与系统的交互次数,提升农产品信息查询的准确度与可靠度。

2 相关技术

2.1语义检索

2001年Tim Berners-Lee在《科学美国人》杂志上发表了论文“The Semantic Web”,标志着语义网的诞生。语义网是一种使用可以被计算机理解的方式描述事物的网络,为解决网格这个智能性不足的问题提供了答案,可以认为其是一个拥有着层次结构的技术栈:一套可以被各类软件代理(software agent)理解的用来描述数据的通用语言, 如RDF、RFDS、OWL 及SPARQL等;一组可以把分散数据库中的信息翻译成通用术语的描述(本体Ontology);一套允许软件代理基于這些术语所描述信息进行推理的规则(Rules)[6]。语义搜索对网页文档信息所蕴含的语义信息进行充分挖掘,同时把用户的检索要求转换成相应的语义表示,基于领域本体对其进行辨别和推理,从语义层面理解用户查询,并将基于本体推理的结果返回给用户[7]。

2.2本体

斯坦福大学的人工智能(AI)专家Tom Gurber解释说,本体是指“使程序和人们共享知识信息的概念模型的规范说明”。简单地说, “本体”就是精确定义了某一领域的可以被计算机理解的,且被该领域所共同接受的一些概念,以及描述这些概念的特性(property)、概念之间的关系的属性(attribute),以及属性的约束(constraint)等。本体是对领域知识共同的理解与描述,是实现语义网技术的关键。

本体的结构可以定义为一个五元组,即Ontology={C,R,H,Rel,A},其中C代表概念的集合,其包含很多方面,可以是行为、方法等等,每个概念都有相应的属性对其自身进行描述;R为关系集合,关系是概念之间的相互关联,最常出现的有四种关系为Part-of整体-部分关系,Kind-of继承关系,Instance-of实例关系,Attribute-of属性关系; H代表概念层次,即概念间的分类关系,Rel表示概念之间的非分类关系,A表示本体的公理。目前十分流行的本体构建工具是Protégé,它属于开放源代码软件。

2.3推荐系统

推荐系统可以说是一种信息过滤 (Information Filtering) 机制,该系统主要依据使用者的喜好、兴趣、行为或需求,过滤出使用者潜在需求的信息、服务或产品,从而减少使用者在搜寻信息过程中所附加的额外成本。目前无论是传统的推荐系统还是基于本体技术的推荐系统,推荐方法都可以分为: 协同过滤推荐、基于内容的推荐、基于知识的推荐和混合推荐等。基于本体技术的推荐系统仍然采用了传统推荐系统中算法的核心思想,但是在具体实现细节上,结合本体技术的优势,对传统的推荐算法进行改进,从本质上解决传统推荐系统中存在的问题[7]。推荐系统的主要作用是在信息生产方和信息消费方搭建起桥梁,从而建立连接。以个性化推荐技术为核心的推荐系统已广泛应用于电子商务、多媒体资源点播、电子旅游及社交网络等领域。尤其在电子商务领域,几乎所有的平台Amazon、天猫、淘宝、京东等均不同程度地使用了各种推荐系统主动为用户推荐其感兴趣的信息。

3基于农产品本体的语义检索与推荐框架

3.1系统框架

我们提出的系统框架如图1所示,运用语义网中的语意分析技术,从农产品电子商务交易平台获取农产品信息进行分析,将处理过的信息装入农产品信息库、语义词汇库和农产品本体库。

3.2农产品知识本体构建

本研究建立农产品本体模型的基本思想是对农产品的属性特征进行组织表示农产品知识。图2描述了基于属性特征的农产品本体模型的基本结构。

根据前文定义,农产品本体定义为一个五元组:FarmProduceOntology={C,R,H,Rel,A}。类集合C尽可能多收集农产品领域所涉及的术语和概念,如分类、产地、食用方法等。基本的语义WordNet词典中涵盖了农产品与其有关的概念的分类(我们使用的是WordNet汉语开放词网,可从以下网址下载:http://compling.hss.ntu.edu.sg/cow/)。在WTO农产品协议中,所定义农产品主要就是HS分类中的前24章的产品。根据这一原则我们将C中的农产品分为动物、植物、动植物分解品及动槙物加工品4一级概念,24个二级概念,层次最多为5层的农产品本体概论集。属性集合R包括对象关系属性和值关系属性,其中对象关系属性ObjectProperty用来描述类间的关系,值关系属性DProperty描述概念与数据类型间的关系。属性作用域Rel通过对R中属性的定义域和值域进行限制连接了本体中的概念。公理体系A是农产品本体中类和属性的限制描述。

3.3语义查询和语义分析

当用户进行语义搜索的时候,如搜索“安徽砀山出产哪些水果?”,系统的语义分析模块分为两个关键步骤,即断词断句和关键字提取。中文词法分析是中文信息处理的基础与关键。张华平博士开发的NLPIR汉语分词系统(http://www.nlpir.org,自然语言处理与信息检索共享平台提供下载),主要功能包括主要功能包括中文分词、英文分词、词性標注、命名实体识别、新词识别、关键词提取等,并且提供一套完整的动态连接库可以直接在自己的系统中调用来实现汉语词法分析。如前文安徽砀山出产哪些水果?系统会分词标注为:“安徽/ns 砀山/ns 出产/v 哪些/ry 水果/n”,然后系统提取出的关键词:“安徽砀山”,“水果”送往Jena处理。

3.4推理机和推荐生成

推理机(Jena )来处理农产品知识本体OWL 与RDF文件。例如“安徽砀山出产哪些水果?”语义分析模块将会提取二个关键词:安徽砀山、水果。SPARQL通过关键词查询RDF获数据,便可获得安徽砀山出产的水果品类信息,如梨、苹果、黄桃等。当用户点击了黄桃后,系统会呈现黄桃的信息,同时会向用户推荐黄桃的加工品黄桃罐头等。

4结束语

语义网可以理解用户输入语句真正要表达的意思,减少不必要的模糊字词查询。本体技术将数据转换成结构化OWL文本,可以提高数据搜索速度与准确性。我们结合农产品信息检索和语义网的语义分析技术提出的系统框架除了能让用户检索一般的农产品信息外,还能使用语义查询功能直接查询农产品知识并能向用户推荐关联信息。另外我们提出的框架还有需要改进的地方,例如,可以结合用户的检索历史和自填写信息构建用户模型,分析用户的情景化偏好,实现农产品信息的个性化推荐。

参考文献:

[1]范顺忠,陈浩.基于兴趣感知和时间因子的个性化菜品推荐[J].计算机应用研究,2018,35(2):358-361.

[2]秦志远,黄海松,张慧.基于本体和物联网的农产品推荐研究[J].食品工业,2017,38(4):165-169.

[3]彭洁,徐剑晖,陈超.电子商务中基于潜在类回归模型的农产品个性化推荐方案[J].江苏农业科学,2017,45(12):274-278.

[4]于超,王璐,程道文.基于本体的教育资源语义检索系统研究[J].吉林大学学报(信息科学版),2018,36(2):207-212.

[5]刘小乐,马捷.语义网环境下基于本体的知识集成研究进展[J].现代情报,2015,35(1):159-163.

[6]T.Berners-Lee, Linked Data-Design Issues [EB/OL] (2019-03-06). https://www.w3.org/DesignIssues/LinkedData.html.

[7]刘琪,王小正,王磊. 基于本体的教育资源语义检索关键技术研究[J].电脑知识与技术,2014,10(16):3872-3875.

[8]唐晓波,魏巍.基于本体的推荐系统研究综述[J].图书馆学研究,2016(18):7-12.

【通联编辑:王力】

猜你喜欢
本体
Abstracts and Key Words
灰铸铁缸体本体抗拉强度提升的研究
眼睛是“本体”
对姜夔自度曲音乐本体的现代解读
领域本体的查询扩展和检索研究
基于本体的机械产品工艺知识表示
本体在产品设计知识管理中的应用研究
《我应该感到自豪才对》的本体性教学内容及启示
一种基于本体的语义检索设计与实现
媒介生存:关于新闻史研究本体的思考