教育资源本体构建与检索研究

2017-01-03 10:16刘振峰
课程教育研究 2016年11期
关键词:教育领域本体

刘振峰

【摘要】本体是信息领域近年来受到普遍关注的一个研究方向。针对教育资源管理现状,本文阐述了本体的基本理论,提出了一种本体构建模型和检索模型。

【关键词】本体 教育领域 本体构建 本体检索

【课题项目】本文为山东省高等学校科技计划项目“基于本体的教育资源表示与集成研究”的成果之一,项目编号:J13LN03。

【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2016)31-0002-02

随信息技术的不断发展,教育信息资源数量随各教育部门信息化建设的进程不断增加,层出不穷的学习资源在给学习者提供便利的同时,也让学习者面临难于选择合适资源、资源内容不符合自身要求等问题。近年来本体(Ontology)在信息领域引起大家的重视。作为一种有效表示知识层次和语义的概念模型,本体论已被广泛应用于图书情报处理、知识管理、网络搜索、数据集成、语义Web服务等领域之中。

一、本体理论

在哲学概念中,本体是指对事物自身的抽象,描述的是事物的性质或其根源。在计算机界,普遍认为“Ontology是共享概念模型的明确的形式化规范说明”[1]。这个定义主要包括四个主要方面:概念模型(conceptualization)、明确(explicit)、形式化(formal)、共享(share)。

本体的目标是获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定领域内共同认可的词汇,并从不同层次的形式化模式上给出了这些词汇(术语)和词汇间相互关系的明确定义[2]。构造本体对实现知识共享和重用、提高系统通讯和互操作、提高系统可靠性都有重要意义。

在计算机领域,本体论包含类(class)、关系(relations)、函数(functions)、公理(axioms) 和实例(instances)5个基本的建模元素。

本体的实现要通过本体语言进行。本体语言种类繁多,既有专用的本体语言,也用基于某种标准的本体语言。在网络资源处理中,OWL(Web Ontology Language)是W3C组织推出的标准网络本体语言。

二、本体的构建原则

本体的构建是一个复杂的系统化过程,目前没有一个标准的本体构建方法。本体构建原则最有影响的是Gruber(Toward Principles for the Design of Ontologies Used for Knowledge Sharing)在1995年提出的5条规则[3]。

1.清晰(Clarity)

本体必须明确的定义相关术语的含义。该定义必须是客观的,与其周边因素相互独立。

2.一致(Coherence)

本体所定义的公理及使用自然语言进行描述的文档应当一致,并支持延展的、与定义相一致的推理。

3.可拓展性(Extendibility)

本体应是可拓展的,以已有的定义为概念基础,可以不需对已有定义进行修改就对拓展出的新术语进行定义。

4.编码偏好程度最小(Minimal encoding bias)

构建本体时,对概念的描述尽可能采用通用的方法,不要依赖某一种特殊方法。

5.本体约定最小(Minimal ontological Commitment)

本体构建时只需考虑最基本的共享知识即可,这样可以尽可能的减少约束。

这5条规则对本体的构建提出了基本的原则和思路,但并没有提供明确的易于操作的手段。在本体的构建中,我们要根据实际应用的需求,灵活使用这些规则,构建出高质量的符合我们要求的本体。

三、教育领域本体构建

本体的建设应当面向用户的需求,根据教育资源信息处理的特点,教育领域本体应该能够清晰地表示教育领域主要的概念术语、属性以及相互关系,对教育领域活动所具有的属性规律进行形式化的描述[4]。用户的学习程度、知识的更新、技术的发展等,都是本体构建时需考虑的因素。

本文结合教育资源建设中的课程资源建设,提出一种本体构建方法,流程图如下(图1)。

1.需求分析

该阶段的任务是明确整项工作的目标、用途、知识范围。主要包括:本体构建的目的是什么,要针对何种应用、达到何种目标?本体针对什么样的目标人群,构建过程中涉及哪些知识领域?本体构建要采用哪种本体语言?对于课程资源建设来讲,就需考虑课程建设的最终目标、针对的学习者情况、涉及的知识点及其衍生的知识点等。

2.确立目标任务

该阶段对本体构建的过程进行详细规划。要根据本体构建的最终目标,结合具体的需求和资源情况,制订出详细的实施计划。需明确的内容包括本体构建的方法、参加任务的人员情况、人员的分工、任务的时间节点、各阶段需达到的目标等。

3.本体信息采集

该阶段需对领域相关信息进行充分的分析,相关的专业文献、书籍、网络信息、其它的本体等,都是该阶段需关注的内容。中国图书馆分类法编委会教育专业分类表编辑组编辑的《教育主题词表》是信息采集中一个重要的参考和依据。对于课程资源,需要采集各知识点,明确知识点所针对的资源及知识点的前导后继、相互关系等。

4.确定重点概念,形成概念体系

在信息采集的基础上,通过对知识的分析和征集专家的意见,确定该领域中的重点概念,并用精准的术语进行描述。对于课程资源中的重点知识,应按照一定的规则对它们进行划分,形成不同的知识范围,在同一范围内,在考虑前导后继、整体和部分的基础上,去除重复的和不相关的知识。

5.利用本体语言和工具,进行可视化编码

选择合适的本体语言工具,进行可视化编码,建立可实现检索和扩展的本体库。本体的表示语言很多,其中OWL(Web ontology Language)是语义表达能力最强的描述语言。[5]

6.本体确认与评价

对本体进行编码描述后,还需通过测试进行本体确认和评价,包括是否满足本体构建需求、本体描述是否清晰、关系的完整性等。

7.存储

按照本体存储介质的不同,本体的存储方法大致分为基于内存的存储方式、纯文本存储方式、基于数据库的存储方式和专门的管理工具方式四种,其中研究最多、应用最广的就是基于数据库的存储方式。[6]课程资源建设一般采用以数据库存储为主,其它手段为辅的存储方式。

本体构建完成后,还应按照构建需求和学科的发展,对资源库进行进一步的优化完善和后续建设。

四、教育领域本体检索

传统的信息检索模式是使用搜索引擎,利用关键词进行查询,检索结果的准确性不是太高。利用本体技术检索能加强用户与资源之间的语义沟通,大幅提高检索结果的准确性。

在教育资源本体构建模型的基础上,建立教育领域本体语义信息检索模型,如图2所示。

该模型包括用户接口、语义处理模块、数据存储模块等几项内容。

用户接口负责实现同用户的交流,主要包括用户界面、语义查询接口、语义标注接口、服务调用接口、资源采集接口等,负责将用户的输入转换成本体相应格式,并调用语义处理模块进行处理。

语义处理模块主要包括资源预处理、概念提取、索引、查询等,负责完成信息的收集与检索功能。该部分的效率决定了整个系统的效率。

数据存储模块包括教育领域本体库、索引数据库、资源库,分别完成对领域知识、资源元数据和资源的存储。

五、总结

针对目前教育信息化建设中存在的问题,本文研究了利用本体在教育资源集成中的应用,提出了构建教育资源本体库和本体检索的模型。本体的构建是一个长期复杂的过程,不可能一蹴而就。本体技术及相关研究正在快速发展,相信随着相关技术的进步和成熟,各种基于本体的教育资源管理平台会大量出现,推动我国教育事业进一步发展。

参考文献:

[1]Paolo Ciancarini,A bibliograpghy on coordination.1997.

[2]廖军. 基于领域本体的信息检索研究[D].长沙:中南大学,2007.

[3]Gruber T. Towards Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal of Human?鄄Computer Studies,1995;43(5~6).

[4]马捷.教育领域本体构建研究[J].情报理论与实践,2012(7):104-108.

[5]Muller H M,Kenny E E,Sternberg P W.Textpresso:An ontology?鄄based information retrieval and extraction.

[6]傅柱.本体存储技术研究综述[J].情报理论与实践,2013(9):118-123.

猜你喜欢
教育领域本体
Abstracts and Key Words
对姜夔自度曲音乐本体的现代解读
人工智能视阈下教育领域各层次的战略管理框架
3D显示技术在教育领域的应用研究
基于本体的机械产品工艺知识表示
《我应该感到自豪才对》的本体性教学内容及启示
教育领域综合改革成功运行的三大机制
对深化教育领域综合改革的初步认识
反差——阿伦德
教育领域综合改革需要全民戮力而行