基于Hadoop数据系统的数字档案馆信息服务模式研究

2018-05-26 09:50云雅
卷宗 2018年11期
关键词:数字档案馆

云雅

摘 要:随着数字化档案馆技术应用研究的开展,Hadoop信息技术在档案馆信息服务中得到了广泛应用。本文结合Hadoop技术特征,开展了其对数字档案服务影响、新型服务模式建立支持以及应注意的主要问题研究,为这一技术应用发展提供技术理论支持。

关键词:Hadoop;数字档案馆 信息服务模式

随着大数据云技术时代的来临,利用新型数据处理技術促进档案管理数字化建设,进而为数字化档案馆建设提供技术支持就成为了档案数字技术研究的重要组成部分。在这一过程中,Hadoop得以在大数据处理以及云平台应用优势,在当前的数字化档案馆建设中得到了广泛应用。因此技术人员开展了Hadoop数据系统技术支持下的的数字档案馆信息服务研究,并将其定为2016年海南省哲学社会科学规划课题“基于分布式系统的档案资源集成平台模式研究”[项目编号:HNSK(ZC)16-47]的成果之一,进而为我国数字化档案建设提供支持。

1 Hadoop数据系统对数字档案馆信息服务影响研究

Hadoop在应用中可以对大量数据进行分布式处理,在使用中具有一种可靠、高效、可伸缩的处理优势。因此在这一技术支持下,传统的数字档案馆信息服务模式也受到了较大影响。这种影响是在Hadoop大数据与云平台技术支持下产生的。

1.1 促进服务理念转变

建设服务主导型数字档案馆,是未来数字档案馆发展的必然方向,也是大数据时代档案馆发展的主要特征。而在这一转变过程中,Hadoop数据系统是一种集技术、服务于一体的技术服务手段。在大数据支持下,系统将传统的逻辑分析处理方式,逐渐转变为大数据挖掘收集、数据量化与相互关系分析过程,进而提出优化服务方案的服务模式。这种服务理念的的转变在大数据技术支持下,可以有效提高数字档案馆信息服务质量与效率。

1.2 拓宽数据化信息资源

档案馆馆藏信息资料是数字化档案馆服务运行的基础。随着大数据技术的发展,数字化档案馆的存储量已经可以达到PB级。而在实际应用中,Hadoop的框架最核主要包括了HDFS和MapReduce,两个主要组成部分。其中HDFS就是海量数据存储技术,可以为PB级数据储存提供支持。这种储存规模的扩大,在数字档案馆应用中可以发挥以下两方面作用:一方面海量储存功能作用的发挥,确保了馆藏信息资料存储量的提升;另一方面也是其与云平台服务提供了衔接。

1.3 为信息服务提供高效技术支持

在大数据时代数字化档案馆技术发展中,技术管理者使用Hadoop信息技术,有效的提高了档案馆技术水平。这种技术的水平的提高包括了以下两个主要部分。(1)分析处理技术的转变。在传统数字化档案时代,由于数据处理能力较低,因此处理装置会采用抽样分析方式,处理数字化信息,其分析与处理能力受到严重制约。而在Hadoop技术支持下的新型数字化档案管理中,其分析方式已经向整体分析处理方式转变,进而提高了数字化系信息服务的完整性、准确性与深入性,进而实现了档案管理的数据科学目标。(2)非结构化数字信息模式的形成。随着档案馆数据信息量的增加,非结构化数据已经成为了其数据信息的主要组成部分。而Hadoop技术就是一种对非结构信息进行分析处理,并最终根据统一标准进行存储的信息处理技术措施,进而有效的提高了档案分析服务质量与效率。

1.4 促进服务策略转变

Hadoop信息技术是一种基于大数据与云平台结合的信息化服务技术。因此这一技术应用的目标就是实现云平台网络档案服务战略的形成。这一战略包括了以下两个组成部分。(1)档案馆云平台服务策略。这一策略就是改变数字化档案馆原有的基础服务模式,而是通过云平台将其服务延伸至整个网络平台中,在信息安全许可条件下为社会群体、大数据挖掘等提供有效的档案服务工作。(2)形成数据挖掘下支持下的数字化档案馆。在云平台与大数据支持下,Hadoop可以将大数据挖掘出的信息数据融入自身数据库进行保存,利用智能化模式自行完善档案库数据信息。这种功能的形成将会是我国未来数字化档案馆服务能力提升与策略调整的主要方向。

2 Hadoop技术支持下的档案馆信息服务新型模式

在Hadoop信息技术支持下,我国的数字化档案馆在服务模式中已经有了较大转变,形成了一些新的服务模式。

2.1 一站式服务模式

在信息化时代,读者对于档案馆信息的需求是海量、高速而又专业化。因此档案馆数据信息要求是大数量、整合化的数据内容以及一站式信息服务模式。而在这一过程中,如何实现海量数据存储与分析整合,实现其数据库资源的高效共享也就成为了档案馆信息服务的核心技术。而在Hadoop技术中HDFS与MapReduce模块的结合,再通过Cloud Computing、GFS等技术支持,即可实现海量存储中,各类不同结构、存储位置的数据资源,快速的汇聚和融合,形成一站式的档案高速搜索与阅读平台。

2.2 分众服务性能的提升

随着信息时代发展,数字档案馆已经逐步由专业服务向公众服务模式转变。在这一过程中,Hadoop信息技术的应用可以为公众化发展提供以下的三个方面支持。(1)提供海量的数据支持。在档案信息服务中,公众对于档案信息的要求内容复杂、数据量大,因此需要档案馆海量数据信息支持,进而保障满足公众对数据的需求。而海量储存恰恰是Hadoop信息系统的主要特征之一。(2)为多平台服务提供支持。在公共档案信息服务中,其使用的服务平台数量较多,且往往处于同时服务的状态。而Hadoop信息技术的一个优势就是擅长分布式计算,这种模式可以实现档案信息服务快速地跨多台机器开展大型数据的集合处理服务。特别是在档案馆云平台运行中,多台处理器同时服务有助于档案服务数量与效率的提升。(3)公众服务改造成本低。在档案公众服务中,技术改造与使用成本过高会严重影响档案信息服务的普及与发展。而在技术实践中Hadoop 与其他类似技术相比较,其依赖于社区服务模式,且其技术是开源的,进而保证了项目软件成本的降低。

2.3 智慧型服务模式的实现

在云平台与大数据技术支持下,Hadoop信息技术已经可以在原有的数字档案基础上形成由数据挖掘、云平台数据信息信息共享以及系统内海量信息智能化搜索同步完成的智慧型服务模式。这种服务模式除了一站式服务过程外,还包括了智能性服务。这种服务是系统根据档案使用者信息搜索痕迹,利用云计算与MapReduce模块处理,形成智能化档案服务模式,即根据模糊搜索、热点搜索、智能分析等方式,在网络云平台中实现大数据搜索,智能分析,最终最大化实现客户需求的服务模式。这种智能化服务模式的形成与一站式服务进行有机搭配,将形成模拟人类智慧的服务模式。这里需要注意的是,这里所指的智慧型服务只是接近人类智慧的一种人工智能模式,就目前技术而言,还是无法完全代替人工服务,因此系统操作过程还是需要由档案技术管理人员完成。

3 服务模式转变中应注意的几个问题

利用Hadoop信息技术促进数字化档案信息服务改革,进而促进数字化档案馆服务模式转变,是当前数字档案技术改革的重要内容。但是改革中技术与管理者也应注意以下的几个问题。

3.1 档案信息安全问题

在档案管理中,档案信息安全是其最为核心与重要的管理要求。Hadoop以及档案管理系统的整体安全,直接决定了系统能否为客户提供优秀的信息服务,因此重视系统安全问题将一直是数字档案系统技术管理的核心内容。而在大数据网络平台中,安全问题也是一直困扰档案管理者的主要问题。虽然Hadoop技术虽然具有较强的可靠性,但是其网络安全性能也需要安全系统的有效支持。如在系统软件系统中需要采用较高级别的安全软件,提高系统对木马、病毒等外来侵害的抵御能力。

3.2 需求为导向的系统服务建设

客户需求目标是档案信息服务开展的基础。因此在Hadoop数字档案系统建设中,用户需求是系统各项服务功能实际的基础。这种以客户需求为导向的服务设计对于系统服务而言具有以下的三个作用:一是避免了功能设置不当造成的浪费。利用需求导向开展系统服务功能设置,可以有效的避免因功能重复设置、无用功能设置等,造成的资源浪费问题,提高系统开发效率。二是利于一站式服务的实现。客户需求的实现是一站式档案信息服务的基础,因此以需求为导向开展服务建设,也是实现一站式服务模式的基础。三是为档案公开提供了支持。档案公开是未来数字化档案馆的主要功能之一。在客户需求导向引导下,档案馆可以将各分散数据库中重点公开的内容根据客户需求进行集中公布,有效的提高了档案公开实效性。

3.3 做好自主创新研究

在Hadoop系统已经是一个较为成熟的系统模式,也在数字化档案管理中得到了一定应用。但是由于各类数字化档案管理中对于系统功能要求的差异,因此技术人员应在已有系统模式下做好档案馆自身系统的自主创新工作。这种自主创新研究的开展一方面提高了Hadoop系统对数字档案管理的实践应用性;另一方面也为Hadoop技术应用发展提供了支持,这也是此次课题研究的目的。自主创新不仅仅是表面上的新服务功能开发,而是通过挖掘Hadoop系统内部功能潜能,使其各项功能得到进一步利用,为数字档案馆各项管理水平的提升提供支持。

3.4 服务、技术人才的培养

在数字化档案管理中,服务与技术管理人才队伍的培养对于提高档案服务管理质量起到了不可忽视的作用。在实际的队伍培养与管理中,其人才队伍主要包括了以下两种人才。(1)档案服务型人才。这类人才在档案管理中主要起到服务性作用。因此這类人才在实际工作中需要具备专业的档案管理知识;使用计算机系统(如Hadoop、GFS等)的管理与操作知识,以及良好的档案服务意识。(2)信息化技术人才。这类人才主要负责对档案管理中使用的软硬件系统进行技术管理与维护工作,如定期维护升级软件系统;做好硬件系统维护管理与故障检修;安装维护安全软件,定期进行安全查杀等工作,都是系统技术人员的主要工作。在实际管理过程中,两种工作人员的工作属于相互配合,各司其职的关系,其目标就在于提高系统整体的服务质量、安全性与效率。

4 结束语

Hadoop系统技术的应用不仅对数字馆建设提供了高效的技术支持,也为其信息服务管理的改革提供了有效支持。因此数字档案馆服务管理与技术人员在Hadoop系统技术基础上,以改变服务策略,提高服务质量,创造新型信息化服务模式为目标,开展了Hadoop技术支持下的信息服务模式创新研究。这一研究的开展对于数字化档案馆服务发展起到了不可忽视的作用。

参考文献

[1]文杰.基于云计算的数字档案馆建设研究[J].档案与建设, 2011(1):46-49.

[2]金凡.档案网站资源整合的含义、策略与模式探析[J].档案,2010(1):12-14.

[3]薛四心,黄萃.云计算环境下电子文件管理研究综述[J].北京档案,2011(9):25-27.

猜你喜欢
数字档案馆
浅议企业数字档案馆建设
台湾数位典藏计划对内地数字档案发展的启示