语义本体应用于档案领域的SWOT分析

2020-08-06 08:29宋志萍
兰台世界 2020年7期
关键词:swot分析法档案管理

宋志萍

摘 要语义本体是近几年来越来越被研究者所关注的信息技术之一。文章从语义本体的产生及内涵出发,采用SWOT的分析方法,对于将语义本体运用到档案领域中的优势、劣势、机遇以及威胁进行了深入的分析,并且在此基础上提出了一系列应用的对策,从而推动语义本体技术在档案领域的应用。

关键词语义本体 档案领域 档案管理 SWOT分析法

Abstract Semantic ontology is one of the information technologies concerned by more and more researchers in recent years. Starting from the generation and connotation of semantic ontology, this paper adopts SWOT analysis method to conduct an in-depth analysis of the advantages, disadvantages, opportunities and threats of applying semantic ontology to the archival field, and on this basis puts forward a series of application countermeasures, so as to promote the application of semantic ontology technology in the archival field.

Keyword semantic ontology; archival field; archives management; SWOT analysis method

近幾年来,随着信息技术的不断发展,对于语义本体的研究逐渐被研究者所关注。现如今,语义本体已经在很多领域有所应用,例如医学领域、人工智能领域等,并且这些应用都取得了较好的效果,促进了相关领域的进一步发展。基于此,笔者思考将语义本体应用到档案领域中来,以期促进档案领域的发展。

一、语义本体的产生及内涵

“本体”(Ontology)一词最早产生于古希腊的哲学领域,指的是“对客观存在的系统化解释或说明”[1],即对客观世界中的真实存在所做出的描述。从20世纪70年代起,本体不再仅仅局限于哲学范畴,而是逐渐被应用到信息科学、人工智能等领域当中,为了与之前提到的哲学领域的本体概念相区分开来,信息科学领域的本体被称为“语义本体”。1993年,国外学者Gruber最早提出了信息科学领域中的本体的含义,他认为“本体是概念模型的明确的规范说明”[2],随后本体的概念又经过了一系列的发展,目前学术界普遍认可的概念是由国外学者Studer给出的,即“本体是共享概念模型的明确的形式化规范说明”[3]。

从Studer给出的本体定义来看,其体现出来的内涵主要包括以下几点:第一,共享性,即本体中体现出来的知识为人们所公认,是本领域中共同认可的一系列术语集合;第二,概念化,它是指本体对于客观事物的描述以一组概念的形式进行展现;第三,明确性,这一内涵要求本体中所有术语、属性、公理等都需要有明确的定义;第四,形式化,即本体是可以被计算机“理解”并进一步处理的。

二、运用SWOT分析档案领域应用语义本体的可行性

SWOT分析法是20世纪80年代由美国学者韦里克(H.Weihrich)提出来的,也叫做TOWS分析法。具体说,SWOT分别是指优势、劣势、机遇以及威胁。档案领域在应用语义本体的过程之中,毫无疑问也会受到一系列内部条件和外部环境等因素的综合影响,这说明语义本体应用于档案领域的可行性要素与SWOT呈现出一致性。另外,此前已经有学者将SWOT分析法应用于档案领域。例如,王秋洁、孙军的《综合性档案馆应用人工智能创新管理的SWOT分析》、黄文君的《“互联网+”时代下档案管理工作的SWOT分析》以及孙大东、袁丽娜的《基于SWOT分析法的电子档案“单套制”管理研究》等,由此可见,运用SWOT来分析语义本体在档案领域的应用是完全可行的。基于此,笔者对于在档案领域应用语义本体的SWOT分析如下,优势包括本体的功能强大,主要体现为其知识表示和知识发现功能,另外已有的先进案例也可供参考、借鉴;劣势包括在我国某些档案是保密档案,这些档案视不同的情况而规定相应的密级,在短时间内或永久都不会公开以及档案工作人员对其不够重视;在机会方面,国家出台了一系列的政策予以保障,如《中华人民共和国档案法》《机关档案工作条例》等其中都有相应的条例,并且社会大众也表现出了相应的需求;威胁主要包括本体构建起来难度较大以及本体构建时缺乏一系列标准和规范。

三、档案领域应用语义本体的SWOT分析

将语义本体应用到档案领域中来必定会受到一系列内部条件、外部环境等因素的综合影响,笔者基于SWOT分析法对这一系列影响因素进行了分析。

1.优势分析(Strengths)。

(1)本体具有知识表示与知识发现功能。本体是对领域知识的规范化和抽象化描述,其功能首先表现为它是知识表示和知识组织、知识管理的一种新型方式,它可以将某一领域中概念间的关系进行清晰的描述,实现对该领域知识的整合。将本体应用到档案领域之中,能够对档案领域的知识进行整合和共享,解决档案“资源孤岛”以及语义异构等问题,因此它的出现有助于实现有效管理档案信息资源这一目标,提升档案管理工作的效率,为档案工作带来质的飞跃。其次,在传统条件下,信息检索的方式主要是基于关键词,这种检索方式往往会检索到一些信息查询者不需要的信息,造成信息冗余,无法保证信息的查全率以及查准率。相比之下,当用户查询信息时,语义本体在知识表示和组织的基础之上,能够经过逻辑推理和语义关联发现新的知识,经过语义处理从而满足用户在语义上的需求,从纷繁复杂的数据中提炼出有价值的信息,准确检索,高效、精准地返回给用户所需要的信息,提升用户体验,实现用户对信息的有效访问。

(2)已有应用案例的借鉴。语义本体在国内和国外的一些领域中已经得到了较好的运用。在国内,武汉大学的董慧教授等人将本体引入数字图书馆中,构建了本体数字图书馆检索模型,并在此基础上实现了本体推理、检索以及可视化等功能;在国外,Luan Fonseca等人在BFO顶级本体上提出一个名为GeoCore的核心本体,该本体专门用于描述科学领域,对地质学家所使用的概念和词汇进行彻底的阐明,为通过包含更专业的地质概念推导提供了基础,并且还为在地质领域内整合不同的现有领域本体提供了基础;2011年,IBM公司的Waston在参加综艺节目危险边缘(Jeopardy)的智力问答中首次击败了人类;2019年年底,剑桥联合会举办了一场题为“AI是否会带来更大的弊端”的辩论赛,其中就有IBM辩论机器人的参与,并且最终获得了胜利。IBM的这两个案例中,在分析问题并确定最佳解答的过程中就运用到了语义本体等技术。除此之外,语义本体技术还在其他领域有广泛的应用,诸如医学领域、农业领域等,这些已经存在的本体的应用案例可以为我国将语义本体技术应用于档案领域提供借鉴和参考。

2.劣势分析(Weaknesses)。

(1)档案的非公开性。档案具有许多自身的特性,其中一条就是某些档案需要保密,由于这些档案涉及党和国家的安危或者机关单位的利益等其他方面的因素,因此就需要明确档案的密级。在我国,档案密级的确定要视具体情况而定,有些档案的密级为“绝密”,有些档案密级为“机密”,除此之外还包括“秘密”和“内部”,这在一定程度上造成了档案资源的不开放性。然而,在将语义本体应用到档案领域之中时,无法完全保证涉密档案信息的安全性,在管理的过程之中可能会对涉密档案中的信息造成泄露,这就造成了二者之间的矛盾,非公开的档案资源必然会在一定程度上对语义本体的应用造成影响。

(2)档案工作人员重视程度低。目前,我国的绝大多数档案工作人员都将职能重心放在档案实体管理上,而对于将新兴的信息技术引入档案领域并没有足够的重视,造成这一现象的原因首先是由于到目前为止,我国的档案管理事业还没有纳入数据科学的范畴之中,因此具备信息技术知识如语义本体技术的人才比较缺乏,需要参加相应的技术培训,这使得将语义本体技术应用到档案领域的构想难以成为现实;另一方面,正是由于语义本体技术在档案领域并没有得到广泛的应用,所以造成了传统的档案工作人员对于新兴技术的了解不足,如此一来就形成了恶性循环,所以我国档案人员对于信息技术的了解有待加强,只有这样才能提高自身素质,早日将先进的数据科学技术运用到档案領域,实现档案领域的现代化。

3.机会分析(Opportunities)。

(1)相关政策支持。在我国有关档案的法律法规中,有很多规定都对于将语义本体技术应用到档案领域提供了相应的政策支持。其中,《中华人民共和国档案法》中第十三条规定:“各级各类档案馆,机关、团体、企业事业单位和其他组织的档案机构,应当建立科学的管理制度,便于对档案的利用;配置必要的设施,确保档案的安全;采用先进技术,实现档案管理的现代化。”[4]《机关档案工作条例》中第二十三条规定:“机关应根据需要和可能,采用先进技术设备,逐步实现档案管理的科学化、现代化。”[5]国家档案局发布的第13号令《机关档案管理规定》中第五十八条规定:“机关应当积极实施纸质档案数字复制件的全文识别,将现有图像数据转化为文本信息,便于检索和开发利用。”[6]此外,2016年国家档案局印发的《全国档案事业发展“十三五”规划纲要》强调要“加快档案管理信息化进程”[7]。除上述提及的条例规定之外,还有很多类似的规定,其最终目的都是要加强档案领域的信息化、现代化等,语义本体可以促进档案领域向信息化、智能化发展,为档案领域的发展提供了契机,具有积极影响。

(2)社会需求迫切。处在今天这样一个大数据时代,数据量日益激增,档案存储的形式也日益复杂,各种各样的结构化、非结构化数据诸如文档、图片、视频、音频以及网页等都有可能成为档案保存和管理的对象。然而,不容忽视的一点在于信息爆炸的同时也会带来一些负面影响,其中重要的一条就是信息匮乏,但个人的接受能力是有限的,如果只关注个人所获取信息的数量而不对质量做要求,那么所获取的这些信息无疑是无效信息。与此同时,社会大众也对档案利用和档案服务提出了越来越多样化和个性化的要求,满足社会大众需求的关键就在于如何及时有效地从大量的档案数据中找到档案利用者所需要的信息,而语义本体技术的先进性在于能够从海量数据中发现真正有价值的、对用户有用的信息,用户无需耗费过多的时间和精力便能得到自己想要的信息,因此语义本体的出现为满足用户的个性化需求、提升用户体验提供了可能性。

4.威胁分析(Threats)。

(1)本体构建难度较大。如前所述,本体是用来描述某个领域的概念模型,“某个领域的本体就是关于该领域的公认的概念集,该概念集包含确定的语义和概念之间的关联”[8],由于目前的本体开发基本都是采用人工方式进行的,所以在一个特定的领域之中,找出为领域所公认的术语概念,明确这些术语概念的层次关系以及确定其语义和关联等方面的工作就需要该领域内专家的参与和配合,但同时“专家建模往往带有偏见、具有误差倾向,使得基于领域文档实现本体构建特别是大型本体构建成为一项非常艰巨的任务”[9]。

在本体构建方法的选择上,虽然本体构建的方法多种多样,但是无论使用哪一种方法构建领域本体都需要经过反复迭代,不断排错和修改,最终还要进行本体的检验和评价,确保本体推理能够得出新的、正确的知识,是一项费时费力的工作。除此之外,在建立领域本体的过程之中,需要针对所构建领域本体的需求和目标的不同而对本体开发工具进行选择,例如Ontolingua、OntoSaurus、WebOnto以及Protege等,这些工具的功能各不相同。由此可见,领域本体模型的构建并非是一蹴而就的,它需要经历一个漫长的过程,相对来讲构建的难度也比较大。

(2)缺乏统一的标准。在本体的构建上,许多方面并没有形成统一的标准,诸如本体构建的原则、本体构建的方法等,虽众说纷纭,但并未形成统一标准。此外,在进行某一领域本体构建的流程中,一个必不可少的步骤是要有该领域的语义词汇表,利用语义词汇表可以将该领域中概念的内部逻辑关系进行清晰地描述,在此基础上将领域概念进行语义化,这是领域本体构建的基础。例如,要构建人物相关的本体,可以使用FOAF词汇表、Vcard词汇表以及Realationship词汇表,以上的这些语义词汇表目前都属于通用词表,换句话说在该领域已经形成了统一的规范标准。但在档案领域,并没有一个通用的语义词汇表,需要本体构建者自行创建,不同的人创建的语义词汇表又不尽相同,甚至大相径庭,导致无法形成统一的标准,因此“这也使得Ontology只是作为某一个单独的团体或组织内的共享,真正意义上的共享和重利用仍然没有实现”[10]。

四、在档案领域应用语义本体的对策

由前文分析可以看出,在档案领域应用语义本体能够为档案工作带来知识性的变革,促进档案事业的发展。因此笔者提出以下几点对策,推动语义本体在档案领域的应用。

1.进一步完善语义本体技术。由于本体构建具有很强的专业性和复杂性,目前只是在少数领域进行了尝试性的使用,因此在理论与实际的应用方面还需要加强研究。在理论方面,“Ontology的评价方法以及形式化方法还需要进一步研究与探讨”[11];在实际的应用方面,“Ontology很多都是由人工开发的,这样需要耗费很多的人力、物力和财力,时间周期也很长,这在一定程度上影响了Ontology的应用”[12],另外,本体的集成方法在目前看起来也不是十分成熟。上述的這些问题都对语义本体技术在档案领域的应用带来了不利影响,因此需要对所存在的问题进行针对性的解决,进一步完善语义本体技术,使之向高性能、高适应性的方向发展,使之渐趋完善,日益成熟。

2.加强对语义本体技术的支持。在档案领域进行语义本体的构建并非是一朝一夕能够完成的,因此仍然需要加强对语义本体技术的支持,包括政策支持和资金支持。国家应该鼓励我国的权威档案部门与开展语义本体技术研究的国内外科技信息公司进行合作,并积极参与其语义本体项目,通过实践获取将语义本体应用到档案领域的着手点,同时通过政策也能鼓励更多的档案工作人员加强对信息技术的学习和了解,为语义本体应用到档案领域提供足够的人才储备。在这个过程中,还需要资金支持,资金一方面是运用到与科技公司进行项目合作时的经费支持;另一方面是各级档案机构对档案人员的技术培训资金,由此推动语义本体技术在档案领域中的应用。

3.培养具备语义本体技术的档案人员。档案工作人员需要挣脱传统观念的桎梏,不能简单地认为档案管理只是实体的管理,更需要从现代信息技术的角度着眼,将先进的信息技术应用到档案领域中,由此来提升档案工作的质量,而且今天的图书馆学、情报学和档案学学科领域已经与信息管理和数据科学领域深度融合,为学科理论以及实践都带来了革命性的变化。“早在2001年冯惠玲教授就在中国首届档案学博士论坛上提出,在夹缝时代,档案人员应该将职能重心从实体管理转向信息管理、知识管理。”[13]语义本体作为知识管理、知识组织的有力工具,必将为档案工作带来极大的裨益。所以,就目前形式来看,对于我国各级档案机构来说,优化馆员结构势在必行,还需要对档案人员进行技术培训,优化馆员的技术素养,使档案人员向信息化人才发展。

五、结语

语义本体作为一种新型的知识管理方式,能够有效解决知识共享以及利用问题,将其应用于档案领域能够促进档案事业的发展,实现档案信息资源智能化的管理、共享和利用,使得计算机对档案信息的理解上升到语义层次。因此,应该最大限度发挥语义本体的优势,抓住机会,将劣势和威胁降到最低,推动语义本体在档案领域的应用,提升我国档案工作的质量和效率,实现对档案领域的知识进行高效的组织和管理,为档案事业带来知识管理层面上的巨大变革。

猜你喜欢
swot分析法档案管理
关于企业档案管理体制改革的探讨
新形势下档案管理工作创新探析
新农村建设形势下卫生院档案管理工作探讨
事业单位档案管理创新与改革
提高档案管理科学化水平的对策
档案管理现代化中档案管理原理的运用分析
基于SWOT分析法分析大学校园二手交易市场
新常态下对内蒙古地区非公有制企业的影响分析
寿险公司产品营销策略优化研究
新形势下宜宾港物流金融的发展策略研究