大数据时代档案数字资源整合的难点及对策

2018-01-27 15:33孙亚丽
科学与财富 2017年34期
关键词:难点大数据对策

孙亚丽

摘 要:随着信息技术及互联网技术的快速发展,社会迎来了大数据时代,冲击着人们的生活、工作及思维方式,并对数字档案资源的安全造成了极大的影响。在大数据时代,复杂的网络环境、各种攻击源及威胁的存在、数字档案资源安全保障体系不完善等问题严重威胁到了数字档案资源的安全。本文就大数据时代档案数字资源整合的难点及对策进行简要分析,仅供学习和参考。

关键词:大数据;档案数字资源整合;难点;对策

大数据是指无法在一定时间内用传统数据库软件工具对其内容进行采集、存储、管理和分析的数据集合。数字化、网络化、信息化已深刻地影响了人们的工作、学习、生活和娱乐,数字不再只和计算有关,更使人的生存方式发生了巨大改变,我们已不可逆转地进入了大数据时代。

一、大数据时代档案数字资源整合的难点

1.各种数字资源分散、独立、关联性不强。我们知道档案馆数字资源来源于许多下属档案部门,不同的档案部门提供不同格式的数据资源、 不同的数据库以及不同信息检索工具,这就使得不同部门的档案数据库存储不同类型的档案信息,各个数据库之间没有联系起来,不同的检索工具也只是适合于相应的数据信息。 这就使得档案管理人员很难有效地将这些数字档案信息资源进行统一管理,也使得利用者在查询相关档案信息时需要不断切换检索工具,使用不同的检索方法,为档案信息资源共享和用户利用带来不便。

2.数字档案信息质量参差不齐 ,内容有交叉重复甚至杂乱无序。在档案馆收集上来的大量数字档案信息中,存在着各种质量不一的数字信息,有许多数字档案信息在一些档案部门提交的数据库中存在交叉和重复,也有一些数字档案信息对档案馆只具有数字性而没有价值性。

3.数字档案信息存储格式和检索标准的不统一。无论是数字形式移交上来的数字档案信息,还是将传统载体档案信息转化来的数字档案信息,都存在着不同的数字格式和不同的检索工具。 比如:文本格式就有 TXT、DOC、PDF 等,检索工具也有全文检索、目录检索、主题检索等。 这也使得数字档案信息无法统一到一个信息平台上,无法使用简便统一的管理系统进行管理和利用。

4.目前数字档案信息资源系统大多为目录型数据库,二次数字资源和一次数字资源之间缺少链接关系,用户难以获取全文。

二、大数据时代数字档案信息资源整合的对策

1.明确数字资源整合目标

(1)整合档案馆尽可能多的资源包括:档案馆接收上来的各种电子文件,音频、视频等多媒体文件,由传统档案转化而来的数字化档案,全文数据库,目录或主体数据库,相关的数字资料、文献等。

(2)提供统一的界面并发检过异构资源,即通常所说的集成检索 、联邦检索、跨库检索、平行检索等能提供统一的检索界面,将读者输入的检索工具转换成符合不同资源要求的检索命令进行并发检索, 同时支持检索结果的去重与合并、统一格式显示、多种格式保存等。

(3)提供个性化服务。在档案信息资源共建与共享整合基础上,实现面向不同用户的资源组合和动态性重构,使之与用户需求相适应;在信息资源服务功能上,进行服务功能的整合,使用户能够充分而有效地利用整合资源系统;在用户界面上,进行交互性融合,使整合平台有交往地与用户界面接口;利用信息集成技术,过滤技术、知识挖掘技术,实现基于资源整合的定向服务;在系统个性功能中,能够为利用者提供个性化的学术信息环境和服务,利用者可以创建自己的资源列表和利用某一专题档案列表,建立个人的电子信息架、保存检索历史、设置定题资源提醒等。

2.确定整合资源范围

数字档案信息资源整合对象的种类和数量直接影响到资源整合的策略,因此对整合对象的全面调研和剖析是整合工作开展的必要前提。

各个档案馆应该根据各自数字档案信息资源整合目标和各馆数字档案信息资源特点,确定整合范围。

应包括各档案馆接收上来的各种类型数字档案信息以及自身馆藏数字化的档案信息,通过鉴定它们的内在价值和外在价值,从而通过建立网络数据库,光盘数据库,多媒体光盘等形式来明确数字档案信息资源整合的对象。

3.选择数字资源整合系统

要对多种不同类型的数字档案信息进行整合,并为利用者统一检索平台,就必须自主开发或是引进一种数字资源整合系统。随着数字资源整合的深入研究,国内外的信息学者以及软件商相继开发出了大量的数字资源整合系统。 国外比较典型的数字资源整合系统有以色列Exlib公司的Metalib&SFX, 美国 Endeavor 公司的 ENCompass&LinkFinderplus,美国 Innovation 公司的MAP 等 ;国内的主要有清华同方的TPI 跨库检索系统 、北京拓尔思的 TRS 资源整合门户、江苏汇文公司的一站式文献检索系统以及上海金鑫公司的跨数据库检索系统等。当然,各个档案馆可以根据自身的馆藏数字档案信息特点、整合目标及资金状况,可以选择适合自己的数字资源整合系统;同时,在选择系统时也要结合数字档案的特点对相应系统进行一定的调查,以便最高效地整合数字档案信息资源。

4.制定数字档案信息资源整合的标准与规范

(1)数字档案信息资源采集标准。(2)数字档案信息资源组织与存储标准。 如文本信息的表示和存储、多媒体信息的存储、数字资源分类标准、元数据标准等。(3)信息检索标准。 如多媒体信息检索、异构系统的互操作标准等。(4)网络与网络资源标准。 如传输控制与互联协议、信息资源网站评价、网络信息资源组织标准等。(5)权限管理和安全标准,如加密、水印技术等。(6)其他标准,如文献信息系统质量管理、质量认证体系等。

5.构建数字档案信息资源整合评价体系

对于一个数字档案信息资源整合方案,在实施过程中和结束应该有一定的评价方法和指标体系对其进行规范,使档案馆和开发商都有据可依,实施效果的方法可以采用专家评审法、台阶法、标杆法、定性、定量等方法。 评价指标体系的建立可以从资源数量、资源类型、检索速度、资源利用率、用户数量、用户满意度,接口标准化程度等方面进行考虑。

结语

在大数据时代,对信息资源的开发利用能力已经成为国际竞争力以及国家综合实力的重要因素,当全球范围内数据成为国家资产、创新前沿,要实现数据治国,数据强国,档案部门应勇挑重担,转变思维观念,转变管理职能,由“管档案”向“管数据”拓展,制订大数据战略,创造高效、灵活的云环境,从可信赖的数据源中捕获和提取结构化、半结构化和非结构化数据,优先处理最重要的数据,确定需保留的内容和保管期限。通过整合现有档案馆藏资源,进行数据分析和深度挖掘,把档案资源转化为知识资源,尤其是覆盖人民群众的知识资源,对企业来说,利用这些资源增加竞争能力; 对政府部门来说,使大数据成为国家宏观调控、社会治理的信息基础,提高执政为民的质量和响应力。

参考文献:

[1]徐郁萍.浅析大数据时代档案数据信息资源整合與共享[J].办公室业务,2017(08).

[2]王震宇,王宁.大数据时代图书馆馆藏数字资源整合与存储策略分析[J].中国中医药图书情报杂志,2017(03).endprint

猜你喜欢
难点大数据对策
诊错因 知对策
对策
面对新高考的选择、困惑及对策
防治“老慢支”有对策
注重交流提升数学学习广度和深度探讨
新时期高校思想政治教育管理的创新研究
巧用多媒体技术, 让语文课堂更精彩
基于大数据背景下的智慧城市建设研究