国内知识服务系统研究进展:架构体系与关键技术*

2022-11-09 02:33孙雨生
计算机与数字工程 2022年9期
关键词:本体检索模块

孙雨生 高 希 刘 涛

(湖北工业大学经济与管理学院 武汉 430068)

1 引言

伴随数智化时代来临、知识化经济兴起和数字化社会发展,知识快闪、知识协同创新背景下用户知识需求逐步个性化[1~3]、智能化[2]、复合化与信息资源日益分布异构、海量多源且爆炸式增长形成鲜明对比,数据迷雾、信息过载、知识迷航等问题愈发严峻,致使如何结合用户需求智能提供知识服务进而按对应业务流程选用IT技术高效描述、处理、存储、分析海量多源异构信息资源,以在降低用户认知负荷同时提升知识资源利用率成为亟待解决问题。在这种形势下,知识服务系统应运而生并备受重视,其构建基于用户需求、业务流程建模及IT技术共享、协同分布式知识资源[4]的知识生态系统,以提供旨在支持知识应用与创新、降低知识获取成本及认知负荷[5]、提升知识资源配置效率[4]的知识服务,并降低社会知识运营整体成本、促进社会知识协同创新。传统知识服务系统多基于高性能单机节点、集中式单体架构和面向知识服务业务链(知识可视化、知识应用、知识发现、知识存储、知识加工、知识采集等)局部[2]的关键技术,提供基于列表式展示、关键词匹配[5]的知识导航、问答、推荐、检索等服务,虽部分满足用户需求但难适应海量异构[5]、分布稀疏[6]、复杂多变大数据环境,及其对系统架构支持应用频繁演进、业务并行处理、技术开源集成、资源协同共享[4]、负载动态均衡等和兼容支持知识服务全程的体系化IT技术的更高要求,致使难以有效采集、表示、加工、发现、集成知识资源并遵循业务流程、融合关键技术形成面向用户应用、支持服务全程的解决方案,进而影响知识服务质量[7](深度、广度)、性能(智能性、时效性)及用户体验,因此,系统研究面向大数据环境的知识服务系统架构体系并体系化面向知识服务全程的关键技术问题有重要意义。

考虑到研究结果代表性及数据采集全面性、可行性,本文以知网、万方学位论文库、期刊论文库及维普期刊论文库为信息源,以“知识服务系统”为关键词在题名中检索相关文献:截止2022年5月2日,共获有效期刊论文122篇、硕博论文27篇,合计149篇;全部详读后归纳知识服务系统内涵、核心内容、研究框架及其架构体系、关键技术研究进展并按提及频次、内容质量详细标注,本着覆盖全部文献内容并最大限度反映国内知识服务系统架构体系及关键技术研究进展重要文献原则,剔除相关度低、提及频次少、内容重复文献后确定43篇参考文献;最后阐述知识服务系统内涵、核心内容、研究框架,并从架构体系、关键技术两方面阐述国内知识服务系统研究进展。

2 知识服务系统简介

2.1 定义及内涵

目前,国内尚未就知识服务系统定义及内涵达成共识且相关研究较少,笔者分析现有文献后认为知识服务系统是用户需求[6,8~9]导向、应用场景[6]驱动,遵循架构体系规范化、业务协同并行化、技术体系流程化、知识资源共享化、基础设施集成化等原则,结合知识管理规范、运维与安全标准[10],基于统一用户界面支持用户选择个性化定制、结构化导航、语义化问答、智能化推荐、精准化检索等服务,进而选择相应支持知识推理、更新等业务的服务策略与机制由其结合知识可视化、知识应用、知识发现、知识存储、知识加工、知识采集技术析取加工、集成组织碎片化知识资源并可视化返给用户供其应用、创新,同时按用户反馈动态进化系统功能、优化基础设施配置以加速知识转化[11]、增值的知识级信息系统。就内涵而言,其按特定应用场景下多类型、多层次、多学科用户解决问题[3,5,7,9]、制定决策过程[5]中知识内容[2,6,9,12~13]需求提供知识应用服务供用户选择,进而按服务所需相应业务处理流程选用IT技术采集、表示、加工纷繁复杂[3]、良莠不齐[9]知识资源,以关联、集成特定领域主题、机构、人员、文献等知识对象[5]构建知识网络及体系并存入知识(仓)库,进而通过知识推理[14~15]、知识挖掘获取潜在事实[15]、规则并依托知识检索、知识推荐等服务形式支持用户基于全生命周期知识服务平台[16]、设施采集、应用及创新知识,最终形成促进知识生产加工、传播共享、增值创新[5]的开放性知识生态系统,以提升知识服务质量、性能及用户体验。

2.2 核心内容及研究框架

分析现有文献,笔者认为知识服务系统主要研究架构体系、关键技术、用户兴趣建模、服务机制、知识资源管理、应用实践六方面,研究框架见图1。就国内知识服务系统研究而言,理论研究尚处导向性探索阶段[11]且体系不完整:服务模式不完善[9]且可操作性不强,难适应大数据[17]、人工智能[2]、云计算[4]、区块链[16]等新型IT技术;实践应用研究较少:集中于农业[3,11,18~19]、企业[1,20~21]、图情档[22]、医疗健康[14,23~24]等领域且多研究知识服务系统构建技术问题。

图1 知识服务系统研究框架

3 架构体系

3.1 体系结构

知识服务系统体系结构多为B/S模式[18,21~23,25],常按领域业务内容、应用场景分为基于应用程序接口通信的界面表示(人机交互[26])层(支持基于集成多种接入方式[5,18,21]且附带联机帮助[27]的用户界面动态可视化访问(注册登录[5,28]、浏览检索[4~5,18,28]、反馈[5,13]更新[28]等)以提交请求、展示结果[5])、服务应用层(预分类[5,10]、细化[5,10]、分析[5,10,29~30]用户请求并融合系统功能模块、IT技术,提供个性化定制、知识导航[5,17,31]、知识问答[5,31]、知识推荐[5,8,17,31]、知识检索[8,17,30~31]等服务)、业务逻辑层(智能理解用户请求及行为并结合用户兴趣模型、项目特征模型按业务流程精准匹配用户需求、知识,调用业务校验、资源调用、事务管理[19]等逻辑控制支持系统管理服务,并按用户反馈动态调整业务规则及流程)、知识资源层(统一采集、加工、存储知识)、基础设施层(部署管理软硬件及网络设施)。此外,部分学者在此基础上按所用技术增加相应层次。

3.1.1 农业知识服务系统

陈红叶[18]、陈栋[19]提出B/S模式茶叶[18]、森林经营[19]知识服务系统分为表示(用户[18])层[19](支持用户访问并基于JQuery用Ajax与服务器交互数据[19])、业务[19](功能[18])逻辑层(基于框架法匹配知识并支持事务管理[19]、数据验证、内容更新[18])、数据层(用Servlet响应HTTP请求[18]并基于Hibernate操作数据库)。万敏[11]提出农业知识服务系统分为用户层(用户通过网络、应用程序访问系统以获取解决方案、知识产品)、应用系统层、支持系统层(采集、加工成数字信息资源,构建知识仓库及服务平台,组建专家团队)。

3.1.2 企业知识服务系统

赵婷婷[21]、王道平[31]提出B/S模式机械设计[21]、SOA架构敏捷供应链[31]知识服务系统分为表示层(按用户权限提供多种便于交互式学习的知识服务[31]并支持管理员维护扩展、专家审核评价知识库[21])、应用(服务[31])层[21](基于SOAP式通信、UDDI式服务管理、XML式数据交换[31]管理知识及系统[21],前者管理知识浏览检索、更新输出、测试推理等,后者管理用户权限、系统维护、事务处理、出错处理、安全控制等)、数据(知识[31])层[21](抽取、转换、存储数据[31])。卞建萍[1]、李广[20]提出业务过程知识管理[1]、制造业[20]知识服务系统分为用户(应用[20])层[1]、主动服务(中间[20])层[1](基于用户兴趣模型及业务过程中任务[1]确定用户知识需求,并据此过滤按业务知识需求模型通过本体映射所获知识集进而动态进化[20]用户兴趣模型)、知识描述层(基于本体同质化知识源结构、语义)、知识源层。张曌[32]提出产品设计知识服务系统分为服务用户层、服务应用层(采集、检索和解释知识)、服务基础层(动态更新知识库)。

3.1.3 图情档知识服务系统

袁芳[5]、黄雪梅[10]、王珊珊[28]、李连喜[29]、吴新年[30]提出基于本体的档案[5,10]、引文[28]、图书馆[29~30]知识服务系统分为表示(用户[29~30])层[5](统一用户身份认证并分级授权[29~30]以便其访问[5])、应用(服务[29~30])层[5,10](基于应用解析接口预分类[5,10]、细化[5,10]、分析[5,10,29~30]用户请求,通过可视化界面[10,29~30]提供基于本体推理[10]的应用服务)、业务层[5](按通用业务流程处理业务)、本体层[10,28]、语义层[10,28~30](依托统一规范元数据标准及领域本体模型[10]抽取加工、标注分类、组织关联知识)、知识层[10]、信息集成层[30](集成组织抽取加工所得元数据)、数据(资源[28~30])层[5,10](采集、清洗、存储数据)。陈倩波[4]提出图书馆知识服务系统分为用户界面层、中间控件层(涉及用户、任务、资源及安全管理等控件)、基础设施层(提供软硬件环境并依托云计算并行化计算、分布化存储、协同化共享资源)。李菲[33]提出图书馆知识服务系统分为信息用户层(支持用户接收型、专家建设型及两者混合型用户访问)、服务平台层(按推荐知识类型、特点及信息接受度选择信息传输通道)、服务模块层(涉及用户定制、公众推送、用户共建模块)、服务资源层。丁恒[22]提出B/S模式、SOA架构标准文献知识服务系统分为应用层、服务层(处理数据、提供服务)、数据层(持久化PDF、XML文件及知识本体数据库)。

3.1.4 医疗健康知识服务系统

杨晓燕[17]提出营养健康知识服务系统分为知识服务门户层、知识服务支撑层(按统一规范剔重、分类、加工、存储知识资源进而按既定规则挖掘、重构)、知识资源仓储层(按规范采集、整合数据)、资源加工工具层(提供资源仓储层采集数据、知识服务系统构建所需工具)、系统运维监控层。于哲[23]提出B/S模式健康知识服务系统分为视图表示层(方便用户通过Web接口可视化交互)、应用服务层(按用户请求调用功能模块)、数据存储层。

3.1.5 其他

何宝亮[16]提出基于区块链的知识服务系统分为用户应用层(提供融合知识生态、面向行为、服务、资源、设备等管理信息与应用场景且符合用户习惯、行为的接口及应用程序以支持感知型智慧服务)、合约与交易层(可信节点按既定自动执行响应条件及规则进入合约状态并在符合合约值时自动交易)、数据存储与分析层(基于应用共识机制、云处理、大数据存储、去中心化、数据传输等技术处理、动态存储节点数据及其关系,以支持基于用户感知信息分析其需求)、基础数据层(涉及基础架构技术、数据及算法)。褚冰[25]提出基于知识图谱的B/S模式石油知识服务系统分为应用层、数据层(依托模式层提取并存储各类存储结构中RDF三元组知识)、模式层(按领域本体化资源层所存储文件)、资源层。刘豫徽[26]提出基于Agent的知识服务系统分为人机交互层(用户基于接口注册、提交任务并查看知识推送结果、反馈信息)、知识处理层(接收、分析、检索任务以进化业务知识需求模型及用户兴趣模型进而过滤知识)、知识检索层。王丹[34]提出基于Web2.0的知识服务系统分为用户表示层、业务逻辑层(逻辑处理数据业务)、数据访问层。郑文文[35]提出基于知识网格的知识服务系统分为知识服务层(动态交互以共享、应用知识)、知识组织层(基于知识库互联互操作知识节点)、资源层。

3.2 功能模块

相关研究较少,常按系统功能[1,3,23,25,36~37]及层次[24]构建并随应用场景迁移、用户需求变化动态调整,包括人机交互、系统管理(分配用户权限以管理用户[37]并统一维护安全控制[21]、容错处理[21]、事务处理[21]、日志管理[1,37]、容灾备份[5,10]及运维部署管理等系统功能,同时接受用户反馈信息)、知识服务(按用户权限、需求提供服务应用)、知识维护[25](审核、评估知识并管理模型、算法)、知识存储(存储基本信息、行为信息、需求信息[14]等用户类、资源类知识)、知识加工、知识采集(用人工、半自动、自动等方式[21]按统一规范采集知识)等模块。

3.2.1 农业知识服务系统

马良俊[3]提出农业知识服务系统分为用户中心(支持通过可视化人机交互接口注册信息、提交需求、接受信息推送服务并反馈效果)、服务内容、信息采集处理(依托管理后台采集、处理、存储信息)模块。

3.2.2 企业知识服务系统

卞建萍[1]提出业务过程知识管理知识服务系统分为系统管理(含用户模型管理)、知识服务管理、业务过程知识需求管理(维护业务过程信息及各环节知识需求并管理业务过程)、知识源管理模块。

3.2.3 图情档知识服务系统

丰玮[36]提出图书馆知识服务系统分为知识服务(支持用户交互式浏览、检索、问答、引用知识库)、知识存储(输入(更新)输出(检索)知识)、知识组织(按体系分类法、网络技术法组织文献描述、内容、特色、目的信息)、知识采集(分信息采集、知识加工模块,后者人工筛选、加工、格式化并存储所采集信息)模块。景璟[27]提出图书馆知识服务系统分为系统维护(管理用户及其权限,维护知识版本、分类体系,审批、发布联机帮助等系统级管理知识,备份恢复数据)、模型(知识挖掘模型)管理、知识管理(采集、挖掘、积累及共享知识)、信息资源管理(更新备份信息)模块。袁芳[5]、黄雪梅[10]提出档案知识服务系统分为系统管理(通过门户管理用户账户、资源密级权限,支持用户反馈、容灾备份)、应用管理、知识库管理(管理知识条目及其一致性、知识元关联推理规则、元数据、本体等)、知识源管理、文档一体管理模块。

3.2.4 医疗健康知识服务系统

唐晓波[14]提出健康教育知识服务系统分为知识服务、知识组织(预处理(清洗、集成、变换、规约)、组织知识以构建本体知识库)、知识采集(采集慢性病数据资源、专家及用户知识)模块。于哲[23]提出基于本体的健康知识服务系统分为服务调用(用Servlet调用服务接口)、业务逻辑(基于本体的知识检索和基于本体推理的糖尿病诊断及风险评估)、本体管理模块。邹元平[24]提出中药知识服务系统分为主页管理、报表模拟、数据分析、用户及其权限管理、日志统计管理(统计用户、资源及系统访问情况)、数据库管理(用资源管理器检索、更新数据)、资源管理(管理数据库对象资源)模块。翟兴[38]提出养生知识服务系统分为人机交互、FAQ(智能问答)、语义检索(处理FAQ难解决问题)、知识库构建、数据源模块。

3.2.5 其他

王胜海[13]提出网络智能知识服务系统分为系统管理、知识服务、知识进化(按用户反馈动态调整知识处理算法)、知识存储、知识过滤(剔重以一致化知识库)、资源加工(转换格式、标引知识、生成文摘及简报以知识化数据)、资源采集模块。褚冰[25]提出石油知识服务系统分为知识可视化、知识检索(基于概念、属性、关系、实例等可视化检索)、知识推理(用决策树算法对给定概念参数值或相关实例等进行知识图谱模式层与数据层混合推理)、知识维护、信息维护模块。闫华[37]提出能源知识服务系统分为数据管理(检索、更新数据并生成报表)、用户管理(管理用户权限、日志)、数据处理(采集、格式化、整理、分类并据此存储数据)、数据采集(结构化、排序、筛选并存储数据)模块。

3.3 运行机理

多遵循应用场景多样化、服务功能集成化、业务流程标准化原则,动态、规范描述知识服务流程以调用通过层间接口关联的功能模块进而协同实现面向领域应用、满足用户需求的知识服务。常按普通用户个性需求智能组合服务策略、业务流程以协同功能模块提供知识应用服务:普通用户通过界面表示层人机交互模块多种接入方式[5,18,21]访问用户界面以提交需求并由其传给服务应用层,服务应用层按用户权限调用知识服务模块支持其选择知识应用服务进而通过统一访问引擎[10]与知识资源层交互以获取用户所需知识,并结合用户兴趣模型、项目特征模型用知识发现技术处理、生成知识服务模块所需知识[5],进而传至服务应用层由其用对应知识应用技术提供服务并通过界面表示层可视化返给[10,29~30]用户、接受其反馈;按系统管理员用户权限分配、系统部署运维需求智能分配用户权限、自动管理系统运维、动态接收用户反馈:系统管理员基于界面表示层人机交互模块访问用户界面并通过系统管理、知识维护模块提交用户权限管理、系统运维部署、功能模型配置需求,进而与基础设施层交互以分别动态维护用户权限、软硬件部署、运维功能模型配置信息,同时通过系统管理模块动态接收、集中管理用户反馈信息。

3.3.1 农业知识服务系统

陈红叶[18]提出茶叶知识服务系统运行流程:用户通过用户界面与系统交互并提交需求给功能逻辑层由其与数据层(含用户兴趣采集、知识采集模块)交互(通过Servlet响应HTTP请求)以获取、处理所需数据后交由知识推送模块提供主动知识服务。万敏[11]提出农业知识服务系统运行流程:用户提交需求给用户层应用程序由其交给应用系统层,应用系统层通过知识仓库、专家咨询系统获取、处理支持系统层通过信息采集、加工、标准化、数字化等技术处理所得数据进而提供解决方案、知识产品。马良俊[3]提出农业知识服务系统运行流程:用户通过系统界面用户中心模块提交需求及反馈给服务内容模块由其与信息采集处理模块(用人工、自动采集(Web Spider)技术采集、整理、存储信息)交互以获取、处理所需信息后提供系统化功能服务。

3.3.2 企业知识服务系统

赵婷婷[21]提出机械设计知识服务系统运行流程:用户通过表示层按权限访问并调用相应功能模块以提交请求给应用层由其与数据层交互并获取、处理知识,以支持用户检索学习知识、管理员维护拓展用户信息、专家评价审核知识并由表示层展示给对应用户。王道平[31]提出敏捷供应链知识服务系统运行流程:用户通过表示层按权限访问系统导航及知识服务并提交请求给应用服务层由其基于SOAP、UDDI分别实现消息通信、服务管理,以调用知识地图、知识检索、专家黄页等知识服务进而通过处理知识层基于三层数据体系采集、存储的数据实现功能服务。

3.3.3 图情档知识服务系统

袁芳[5]提出档案馆知识服务系统运行流程:用户通过表示层档案知识门户访问、学习知识并提交需求给应用层由其基于应用解析接口预分类、细化、分析后调用知识服务程序与业务层交互,业务层与数据层交互并通过统一数据访问引擎获取档案数据后交由业务逻辑算法处理进而交由应用层基于本体推理提供知识服务并通过人机界面返给用户,同时按用户反馈进化数字档案本体、用户兴趣模型及知识需求模型。

3.3.4 医疗健康知识服务系统

唐晓波[14]提出健康教育知识服务系统运行流程:按用户需求调用知识服务模块与知识组织模块交互以获取按一定原则、方法及知识体系序化后的知识采集模块所采集数据,进而用知识检索、推理等技术提供知识导航、知识地图、自动问答、知识推荐、知识检索等健康知识服务,并按用户反馈动态进化系统知识采集、组织、服务形式。

3.3.5 其他

王胜海[13]提出网络智能知识服务系统运行流程:按普通用户需求调用知识服务模块相应服务由其处理经资源加工、知识过滤、知识存储模块处理后资源采集模块所采集信息以生成、存储知识并支持相应知识服务,将用户反馈交由知识进化模块处理以进化资源加工处理算法、知识服务系统功能;按系统管理员需求调用系统管理模块管理系统功能及配置。

4 关键技术

常按知识服务业务流程分为知识可视化、知识应用、知识发现、知识存储、知识加工、知识采集六类,以提高知识服务系统业务处理效率、服务质量及性能,共性技术为本体(同质化异构知识、丰富语义)、知识图谱、语义网,支撑技术为用户兴趣建模、业务流程建模、云计算(分布式计算各知识服务系统资源以重配知识资源[4]、提高服务效率)等。

4.1 知识可视化

研究较少,多侧重知识可视化流程及作用:褚冰[25]通过定义画布(基于D3.js定义初始坐标、宽高以确定展示位置)、获取节点(通过Ajax进行前后端页面交互并基于Neo4j获取)及路径(通过单节点检索、双节点检索与关系检索获取)信息、可视化以辅助用户低负荷认知概念及概念间关联。袁芳[5]、丁恒[22]挖掘、分析、构建、绘制图形[5]以可视化知识内在结构及对象关系。

4.2 知识应用

4.2.1 知识推荐

基于用户基本信息(背景、偏好等静态特征)和行为信息(浏览、检索等动态特征)预测其兴趣、引导其需求[2],通过用户兴趣建模、项目资源建模并基于特征匹配、推荐算法[2]提升知识服务主动性、精准性、智能性[9],常分基于内容推荐[2,9]、数据挖掘推荐[9](用数据挖掘学习用户行为、兴趣特征)、协同过滤推荐[2,9]、混合推荐[9]等。王曦光[9]、唐晓波[14]、何宝亮[16]、王珊珊[28]、李连喜[39]分析用户行为以获取其特征、偏好等显隐性需求[9,39]并标签化[9],基于用户画像[16]、本体[9,14,28]等技术构建用户兴趣模型,通过推荐算法和知识内容标签匹配推荐[9]知识,并通过趋势演化分析预测用户行为[39]以实现智能推荐。

4.2.2 知识检索

结合用户需求、行为并基于本体[28,30,40]、语义网[7]、知识图谱[25]等技术语义扩展、推理检索关键词(提升查全、查准率[7,23]),并据此基于通用搜索引擎[13]、主题搜索引擎[13]、元搜索引擎[11,13]等搜索引擎及框架表示法等知识检索方法[4]精准定位、智能匹配检索结果并按用户兴趣模型序化后显示。于哲[23]、王珊珊[28]、吴新年[30]、寇远涛[40]、程南清[41]提出基于本体的知识检索:语义理解检索请求并扩展(如上下位、同义词、相关词及中英文等[40])、推理[23]检索关键词,据此结合用户兴趣模型构造检索式[41]以检索知识库并按与用户需求相关度序化显示检索结果[28,30]。此外,李连喜[39]用Wiki技术通过横向跨主题领域、资源载体和纵向追踪历史版本实现知识检索。

4.3 知识发现

4.3.1 知识挖掘

通过数据挖掘等技术、算法(粗糙集[9])按流程提取隐性知识以辅助用户决策:景璟[27]将知识挖掘步骤分为知识分类、模型选择及知识挖掘;王丹[34]将数据挖掘分为挖掘对象确定(基于应用范围和用户需求)、数据准备(选择、净化、预处理、变化、压缩数据)、数据挖掘(确定统计分析、机器学习、人工智能和模式识别等数据挖掘方法、算法及查找模式)和挖掘结果的表达、评价及巩固;王曦光[9]用数据挖掘技术挖掘数据(仓)库中知识及规则以辅助决策。

4.3.2 知识推理

多基于本体推理,常结合推理算法用Jess、FaCT++和Pellet等推理引擎[14]智能化推理规则、策略[7,18],以推理新知识或检查一致性进而补全去噪[7,14]知识库:于哲[23]基于Rete算法用推理引擎规则结构相似性、时间冗余性提升推理效率;武博轩[15]基于规则、语义推理拓展数据图状态空间以获取事实支持知识检索。此外,褚冰[25]基于易计算、易理解、易学习的ID3算法结合概念参数值或相关实例推理知识。

4.4 知识存储

按一定规则存储已加工知识于知识(仓)库[21]并动态更新[9]:王曦光[9]按统一存储、管理规范汇总知识后存入知识库并用知识发现系统动态更新;唐晓波[14]用本体表示分散无序知识并构建知识模型以按语义组织知识并存入本体知识库;赵婷婷[21]用知识仓库系统化、集成化存储知识。

4.5 知识加工

研究较少,多通过组织、标引知识来序化知识因子、网络化知识资源[7,14]以便存储,核心是知识组织、知识标引技术。

4.5.1 知识组织

遵循问题知识化、知识概念化、概念形式化、形式规则化原则,依托多维知识体系[5]、组织方法,用分类法、词表等工具序化知识以便机读处理:胡小丽[8]提出知识组织体系分词表(包括可选词单、地名辞典、术语表、字典词典、规范文档、同义词环)、分类体系(包括标题表、粗略分类体系、知识分类表、文献分类法)、关系词群(包括叙词表、概念地图、语义网络、本体等);丰玮[36]提出知识组织方法分体系分类法(明确知识从属关系但难揭示知识关联)、网络技术法;赵瑞雪[6]用知识分析、知识揭示、关系计算等技术组织知识。

4.5.2 知识标引

将待标引知识纳入知识体系并构建关联知识网络[12]:唐晓波[14]、王珊珊[28]、李连喜[29]、吴新年[30]基于领域本体模型[28]、语义规则/模型[29~30]语义标注网络知识[14,29~30]以便机器自动识别领域知识并纳入知识体系,进而构建知识网络以拓展知识库[14]。此外,百华睿[12]按元数据标准、文档内容特征、知识体系选择分类标引、主题标引、本体标引等知识标引方法,混合自动标引与人工干预方式提高知识标引效率;通过反馈修正接口反馈标引错误以提升自动标引算法效能。

4.6 知识采集

混用人工、半自动、自动等方式[21]从既有经验、事实、规则等知识源中归纳抽取知识[42]:赵婷婷[21]、汪国林[43]提出知识采集方式分为人工、半自动(分工明确、业务流程清晰但质量受知识表示模型影响且成本高[43])、自动(涉及自然语言处理[43]、机器学习技术)、众包[43];武博轩[15]提出用户基于本体概念关系及约束并结合自身知识标注实例以半自动采集Web知识。此外,张曌[42]提出基于涟波下降规则的知识采集方法,按规则索引案例、错误结果驱动机制(专家针对错误结果在知识库中添加规则及案例)采集知识。

5 结语

综上,本文阐述了知识服务系统内涵、核心内容及研究框架,并从架构体系、关键技术两方面阐述了国内知识服务系统研究进展:知识服务系统架构体系遵循请求分散化、应用集成化、业务标准化、存储分布化、计算并行化原则,以用户需求及应用场景为导向、以知识服务流程为主线,以IT技术、知识资源及知识服务设施(知识服务应用系统、信息基础设施、软硬件设施)为依托,揭示调用按体系结构分层组织、高内聚低耦合的功能模块协同实现面向领域应用及用户需求的知识服务运行机理:体系结构多为B/S模式,常分为界面表示层、服务应用层、业务逻辑层、知识资源层、基础设施层;功能模块包括人机交互,系统管理、知识服务,知识维护、知识存储、知识加工、知识采集等模块;运行机理按普通用户个性需求智能组合服务策略及业务流程以协同功能模块提供知识应用服务,支持系统管理员智能分配用户权限、自动管理系统运维、动态接收用户反馈。关键技术旨在提高用户需求导向、应用场景驱动的知识服务系统业务处理效率及服务质量,常按知识服务业务流程分为知识可视化、知识应用(知识推荐及检索)、知识发现(知识挖掘及推理)、知识存储、知识加工(知识组织及标引)、知识采集六类。

下一步,笔者将构建基于IT规划参考模型的智慧型知识服务系统架构体系,以供相关研究及实践参考。

猜你喜欢
本体检索模块
28通道收发处理模块设计
“选修3—3”模块的复习备考
2019年第4-6期便捷检索目录
基于本体的机械产品工艺知识表示
专利检索中“语义”的表现
《我应该感到自豪才对》的本体性教学内容及启示
专题
Care about the virtue moral education
集成水空中冷器的进气模块
国际标准检索