数字档案馆建设思考

2017-06-29 09:07金俊兰
关键词:档案室数字化数字

金俊兰

(湖北师范大学,湖北 黄石 435002)

数字档案馆建设思考

金俊兰

(湖北师范大学,湖北 黄石 435002)

在国家信息基础建设中,稳步推进数字档案馆建设是当前形势下多数国家的重要任务,我国亦不例外。数字档案馆虽然在我国已经有了十余年的发展,但目前仍处于初级阶段,我国仍然需要不断探索与思考,促进数字档案馆建设的进一步发展。本文主要从数字档案馆概念及相关研究入手,立足数字档案馆在新技术、新理念中的新发展,对数字档案馆建设进行思考。

数字档案馆;现状;新发展;建设

随着网络信息时代的到来,数字档案室成为衡量档案室信息建设水平高低的标志。尤其最近几年,信息方面新技术、新理念的发展使数字档案室建设成为广大学者研究的重要课题,随之加强的还有各国对数字档案室建设的投资力度,推进了数字档案室的进一步发展。在这种热潮中,如何促进我国数字档案室的理性建设和可持续发展,是我国数字档案室建设当前面临的焦点问题。而在探讨数字档案室在新技术、新理念中的新发展及对数字档案室建设进行思考前,我们首先应对数字档案室及其相关研究有一定了解。

一、数字档案室概念及相关研究

(一)数字档案室概念、特点、优势

关于数字档案室概念的定义,目前尚不统一。概括来说,数字档案室即指依托数字化形式而运行的信息文献档案室,通过数字技术对信息文献进行收集、整理、保存和发布。利用数字技术,数字化档案室可将各种不同载体的信息资源存贮于档案室内,读者只需要通过网络即可对所需的信息进行查询和传播[1]。数字档案室在形式上不仅可以以具体的社会机构或组织存在,同时还可以以虚拟的网站等数字信息集合的形式而存在。

数字档案室的基础为数字化信息资源,数字资源是指通过通信技术及多媒体技术等而获取的信息资源总和,正是在这些数字化资源的支撑下,数字档案室才没有沦为空中楼阁。数字档案室的传递手段为网络化,在这种网络化的传递中促使用户对档案室数字资源的共享得以实现。数字档案室除了注重对网络手段的利用外,还对多种信息技术加以应用,在多种信息技术的支撑下,为用户提供了一个传统档案室中不可能提供的多库连接的信息存取服务。此外,数字档案室具有资源共享的特点,读者对数字档案室资源的访问不用经过室员的中介作用同样可以进行,很多人可同时对数据资源加以利用,在信息资源的获取上既方便又快捷。

相对传统档案室以纸质文献为主的室藏载体来说,数字档案室的室藏中同时可以存在多样的储存介质,如磁盘、光盘、磁带等,使读者获得更丰富是阅读感受。数字档案室在资源的储存上对温度湿度、亮度等储存条件相对传统档案室来说较低,且可复制和备份,能够促进档案室文献安全性有了大幅度提升[2]。与传统档案室相比,数字档案室的存储在纸质文献的保存方面占用房屋的空间较少,且数字化形式储存可节省很多人力。在信息资料的借阅与访问上,数字档案室可通过互联网实时传递,比传统档案室要灵活很多,大大提高了档案室信息使用效率。

(二)数字档案室相关研究

数字档案室当前的研究很多,但追溯到最初的研究时,最先正式将这一研究概念提出的是美国国家研究创新组织。在报告中,他们计划对一种称为数字档案室系统的开放架构加以建立,通过该系统使档案室可以实现为不同地区用户提供服务,使用户能够以机读形式存在的大量分布式信息资源方便地访问。之后的将近30年里,虽然数字档案室的研究越来越多,但其概念定义仍然没有统一下来,不过在信息资源和服务上却已经达成了两点共识。即在信息资源上,数字档案室的资源属于集合资源,且内容海量呈分布式;而在服务上,数字档案室具有传统档案室所无法完成的跨地域服务,对网络访问给予支持是其一大特点之一[3]。

数字档案室研究当前已经具有相当大的规模,并成为档案室研究中的重要组成部分。研究显示,大量的数字档案室系统已经开始投入使用,但在实际应用中,用户面对众多的获取信息途径反而开始出现选择迷茫。对资源的查询往往穿梭于多个系统之间,导致很多时间与精力的浪费。在当前的数字档案室建设中,突出的需求即为资源的整合、集成和共享。在计算机和网络不断发展的过程中,数字档案室技术也随之经历了不同的阶段。数字档案室系统最初为以书目为中心的档案室自动化系统,之后演变为全文资源服务系统,再之后向多媒体数字档案室转变,发展到现在已经转变为提供统一界面使用平台给分散的资源与服务等[4]。不过,当前数字档案室的服务仍然无法完全满足实际的需求,还需要继续研究建设。

二、数字档案室在新技术、新理念中的新发展

(一)网格技术在数字档案室中的应用形成了新型共享模式

网格出现在人们的视野之中,是以一种继万维网之后新型网络平台的姿态出现的。通过网格中间件,网络可以被虚拟为巨大虚拟计算机,该计算机中包含各节点资源总合,网格应用层在使用接口上可由其提供透明和一致的使用接口,这种方式促使网格范围内存储资源、信息资源等高效、全面共享的实现。在网络基础上,用户可对需要的资源加以使用且不需要对资源的具体位置和细节进行了解[5]。

网格技术在数字档案室中的应用,从网络基础架构上为其提供了共享多种资源的途径且是在不同系统之间的共享途径。网络技术可使孤立的系统有所转变,在趋向网格节点的过程中不再孤立存在,促进数字档案室资源实现普遍性共享,同时有利于推进数字档案室实现服务复用目的。对数字档案室中网络技术的应用,国内外都有较多研究,DILIGEN T数字档案室基本架构是其中比较有代表性的项目,该项目使网络技术得以有机融入到数字档案室技术中。

(二)数字档案室集中模式的瓶颈被P2P技术解决

P2P是一种对等网络,在该种互联网模式下每个节点的地位在网络中都是对等的,每个结点既充当服务器,为其他结点提供服务,同时也可反过来享用其他节点所提供的服务(见图1)。在各个网络节点中,P2P网络中的资源和服务是以分散的形式存在的。在这种非中心化的模式下,信息的传输与服务的完成可以摆脱中间环节与服务器,而在节点之间就可以直接完成,这一特点对集中式服务器处理能力具有相当大的改善,弥补了其处理较为有限的缺点[6]。除了这点优势之外,P2P的优势还体现在分布式搜索的实现方面。在P2P技术环境下,可以直接而又实时地完成对等点之间的搜索,避免了传统技术中数据产生实时性不高等缺点,在这一过程中还可以使集中式搜索中覆盖广度与深度不够等突出问题得到解决。在当前的很多领域中,P2P已经开始广泛地与网络技术进行结合。对数字档案室来说,P2P的应用能够提供良好的支持给其分布式管理特性,在一定程度上实现分布式系统间的直接互操作,促进数字档案室中文件内容、存储容量等多种直接共享的实现。P2P数字档案室,是用java实现的,其中的节点可以由每一个参与者所代表,可集中对高度分布的信息资源进行搜索,大大改进搜索效果。

图1:P2P网络模式

(三)SOA与Web服务支持为数字化档案室提供了动态配置机制

SOA作为一种软件设计方法,其在模式上主要是一种面向读物的c/s模式,在其作用下一系列的功能单元被分解出来,这些单元组成了软件系统需要实现的业务功能,其服务的实现主要依赖这些软件组件的封装作用。在松散耦合的关系中,SOA应用系统便在此前提下由许多“服务”和“服务消费者”组构形成,基于这一特点SOA不仅更加灵活,且伸缩性较强,而且在服务复用的功能中,应用系统能够在不断变化的用户需求中实现快速迎合[7]。Web服务这种软件系统是在一定的环境中形成的,具有互操作性,它的格式描述接口在处理上可以用机器进行,对基于XML的SOAP消息传输Web是给予支持的。在服务的理念上,Web与SOA的吻合性很高,且使基于HTTP的SOA应用系统能够实现首次的动态构成。

在数字档案室中,SOA与Web服务的应用从软件架构上提供了一种“可动态配置”机制(见图2)给数字档案室,不仅使异构系统间互操作得以实现,而且促进了数字档案室在客观需求变化的适应上敏捷性大大增加。

SOA在数字档案室中的应用,不断增多是从2005年后开始,其中欧盟资助的DELOS为最具代表性项目。在公共领域对下一代数字档案室体系进行研究与开发,是DELOS的主要宗旨。DELOS的两大贡献在于对第一个完整、规范的数字档案室参考模型进行了颁布,同时对数字档案室管理系统原型进行了建立。SOA与Web服务在数字档案室中的应用,预示着数字档案室动态配置大规模实现的开始。

图2:SOA与Web3.0下的数字档案室平台

(四)云计算与云存储在数字化档案室中逐步应用

云计算的产生并非凭空而来,而是基于分布式处理、并行处理等这些技术基础而产生的。云计算能够催生虚拟超级计算中心,在这一过程中促使超级计算机的功能在更低的成本下实现。云存储这一概念的出现,是基于云计算概念的延伸与发展,云存储可以通过应用软件实现集合并使各种不同类型的存储设备协同工作[8]。数据存储和管理,在云计算系统中为核心存在,当对其进行大量的云存储设备配置时就会促使其向一个云存储系统转变。“云”的概念,在Yahoo、Amazon等互联网服务提供者的推动下得到了很大发展。这些互联网服务者还对云服务的提供加以尝试,对用户通过Web方式对“云”中资源的使用持允许态度,在这种推动下计算机计算、存储能力可转变为公用资源。我国云存储市场规模,近年来也一直不断上涨(见图3),并逐渐应用于数字档案室中。对数字档案室的发展来说,云计算和云存储使其扩充拥有了更多余地。在数据的处理、搜索和挖掘上,常用的SAN架构和标准的关系数据库当前是存在一定瓶颈的,而当数据量达到PB级时这些瓶颈即可得到突破。在数字档案室的建设中,云计算与云存储当前的应用正在逐步进行,从数字化档案室的发展形势来看,在“云”上或迁至“云”上将会成为更多数字档案室的建设趋势。

图3:我国2009—2014年云存储市场规模状况

三、数字化档案室建设建议

(一)立足资源这一根本来对数字化档案室进行建设

从数字档案室的特点可知,信息资源为其建设基础,数字化档案室在建设过程中必须以资源为本。自建资源与购买资源是信息资源中的两大组成部分,其中包括合建资源动态资源、专题信息库等都属于自建资源。对于尚未达到实用阶段的自建资源,必须对其加强建设。动态资源通常产生于教学、科研活动中,是一种非正式的信息资源,但这类资源具有特殊的价值,所以在数字化档案室建设中其组织、管理和发布都需要专业人员来进行。在资源的使用价值上,其主要的决定因素为资源的特色和质量,则两大因素同时对数字档案室的存在价值具有决定作用[9]。数字档案室的资源建设,要对质量控制加以强调,根据既定标准揭示和利用资源,降低元数据二次加工的隐患。

(二)数字化档案室建设要开放体系

在数字档案室建设中,开放可谓其灵魂。作为一个虚拟的概念,数字档案室对分布式管理系统的资源共享和服务双重强调,这一强调对数字档案室系统的开放性便有了较多要求。在对数字档案室进行整体规划和系统设计过程中,必须着重考虑开放性这一重要指标。在用户界面的友好、功能齐全等方面,很多已经建成的数字档案室系统均会考虑很多,但对其他系统如何实现对本系统功能和数据的共性却很少考虑,这种“重内轻外”在数字化档案室建设中是尤其要不得的,容易使其成为信息孤岛[10]。面对未来,数字化档案室建设必须立足大环境,通过合理地封装与开放对世界数字档案室建设经验积极吸收,引导数字档案室建设能够与时俱进,始终走在大环境的前沿。

(三)数字化档案室建设要重视集成工作

集成在数字档案室建设中属于主题式的存在,这里的集成主要指通过对可用资源与服务的充分利用,对数字档案室进行开拓性地组合创新,构建特定的数字档案室。在数字档案室开发中,集成用于最终阶段,通过集成将功能连贯的应用系统提供给用户,在这一过程中数字数字档案室的建设成果可以被更加直观地呈现出来。在数字档案室的集成工作中,开放信息源的多少具有重要影响,掌握足够多的开放信息源是其建设必须,也是数字化档案室建设集成的基础[11]。数字化档案室在建设的过程中,应立足现实中的已有条件正确选择资源集成途径,通过合作等方式将分散的资源和服务进行有机集成,通过资源的开放来实现彼此双赢,形成整体化效应。

(四)数字化档案室要做好安全保障工作

数字化档案室建设还必须注意安全问题,基于计算机技术的数字档案室在建设中会面临着互联网本身所具有的较多的安全隐患,尤其伴随着数字档案室系统的开放的不断提高,其安全问题也随之凸显。数字档案室的安全除了包括安全运行外,还包括安全使用。前者要求数字档案室在建设中必须做好防止非法入侵及病毒破坏等工作,后者要求数字档案室必须对资源的合法使用给予安全保障,其中后者是当前数字化档案室建设中热点和难点[12]。数字档案室建设在对综合的安全策略进行制定时,必须要考虑要用户的方便性,同时还需要考虑不增加过多的额外流量。

在当前的社会发展中,数字档案室相对传统档案室具有突出的优势,与数字档案室有关的研究成果也很多,数字档案室建设是档案室发展的必然趋势。新技术在数字档案室中的应用,进一步推动了数字档案室的建设,不过在建设过程中数字化档案室必须从自身现状出发,立足资源建设根本,做到开放体系、广泛集成,同时要好安全保障工作。

[1] 张红亮.数字档案室建设刍议[J].科学中国人,2015,(9):55-56.

[2]张金雁.数字档案室建设与发展浅析[J].科技致富向导,2015,(6):128-130.

[3]朱长宏.浅谈数字档案室建设与发展趋势[J].中文信息,2015,(6):89-91.

[4]夏立新,胡守敏,刘枫.我国数字档案室研究十年:基于科研项目分析,2010,(5):40-42.

[5]李伟.万丈高楼平地起——浅谈网格计算基础.http://www.iipl.fudan.edu.cn/research/gc.html,2009-12-08.

[6]赵捧未,郭利伟.基于Super-P2P的个人数字档案室虚拟社区知识组织模型构建研究[J].情报理论与实践,2010,33(6):77-79.

[7]孟优优.论档案室数据共享与交换平台的可行性--鉴于SOA的研究[J].数字化用户,2014,(12):91-92.

[8]马晓亭.云计算环境下数字档案室数据安全存储架构与策略研究[J].高校档案室工作,2012,32(4):33-34.

[9] 李跃辉.浅析如何建设数字化档案室[J].现代阅读,2012,(2):88-90.

[10]周义刚.高校数字档案室建设思考——以湖北大学档案室为例[J].情报探索,2009,(5):104-106.

[11]裴亚欣.浅析如何做好数字档案室管理工作[J].今日财富(金融发展与监管),2012,(5):62-63.

[12]刘洪,周明君,刘晖.对我国数字档案室建设的三点思考[J].网络安全技术与应用,2014,(3):230-232.

金俊兰(1967-),女,副研究馆员,主要从事档案信息化、档案信息开发与利用等研究。

猜你喜欢
档案室数字化数字
勘测设计单位数字档案室建设探讨
家纺业亟待数字化赋能
加强综合档案室基础性工作建设初探
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
答数字
数字化制胜
数字看G20
世界
成双成对