利用大数据创新档案管理模式和提升服务能力

2015-03-30 05:15
档案与建设 2015年1期
关键词:档案馆数字化数字

武 云

(中铁四局集团建筑装饰安装公司,合肥,230022)

所谓大数据就是我们可以在更大规模的数据上做到更多我们无法在小规模数据基础上完成的事情,简单地说就是以新方式,在海量规模数据中寻找到新看法、新趋势,然后构建崭新的价值。其内涵可从四个方面来把握,首先是“多”,可以用海量来形容,且是动态的、随时随地、“野蛮生长”的;其次是“广”,无论是数据来源、格式、乃至种类都很广泛;再次是“全”,不局限于部分数据或随机抽样,而是采集全部信息;最后是“深”,用传统思维来看似乎不相关的数据,利用相关技术,将“更多”和“更乱”组合到一起,就能发现原本很可能被忽略的复杂联系,分析出其蕴含着某种规律,这也是大数据的魅力所在。

1 大数据时代下要树立“大数据思维”

1.1 要树立数据就是资源的理念。大数据时代已经成为潮流,开始冲击我们所处的信息时代。当档案化身为信息的载体,又转化为数据,与利用者单向式的“面对面”传统式沟通,被多向、互动式、精准定向的模式取代,如果这些数据借助于各种各样的工具在分析的基础上为我们提供正确的决策,它就是资源。这种资源就像是劳动力和资本一样,确实能带来新的、更大的价值,换句话说,数据也是生产力。

当前,档案管理的信息资源呈现多元化:一是由原生电子档案、档案数字化成果、经济社会运行及管理信息的归档数据库等构成的档案内容信息资源;二是由档案目录、档案索引等构成的档案管理信息资源;三是基于射频识别技术的档案实体信息资源;四是由媒体信息、网站信息、非物质文化信息等构成的城乡记忆资源;五是由挖掘信息等构成的档案应用信息资源;六是由供电信息、温湿度信息、安保信息等构成的档案馆楼宇管理信息资源。这些资源既可以让用户感知和获取档案内容信息,满足利用需求;也可以让管理者感知和获取档案管理知识,协同处理档案业务工作。

1.2 要确立“网络为体,创新为用”的档案管理新模式。以开放的心态、担当的勇气拥抱大数据,摒弃“数据小农意识”,利用大数据带来的机会,突破“传统为体,网络为用”的原有工作模式和状态。如数字档案咨询业务将成为常态。信息咨询将是档案馆最重要的核心业务之一。今后大量的信息咨询将在网络上进行,数字档案咨询将引领档案信息咨询走出困境。为此。我们需更加注重信息交互和咨询能力的提升,从过去被动地回应需求向主动发现需求转变,充分发挥自己的学科优势和专业特长,主动介入到解决用户问题的过程中。

1.3 既要进行档案数字化,更要进行档案信息数据化。因为数据化比数字化更加重要。“数据化”与“数字化”这两者之间有何差异?数据是客观存在的,所谓“数据化”就是将一种现象包括文字、方位、沟通等一切事物转化为可以制表分析的可量化的过程,量化,是数据化的核心。“数字化”就是将许多复杂多变的信息转变为可以电子化存储的数据,把这些数据转变为一系列二进制代码,引入计算机系统,进行统一处理,这就是“数字化”的基本过程。转化为二进制后,一些数据可能具备可计算、可分析、可追踪、可量化的特性,这一连串过程便是“数据化”。存量档案信息和增量电子档案信息只有被数据化后,其巨大的潜在价值才有可能被释放出来,即让数据自己“发声”。档案数字化带来了档案信息数据化,但数字化不能替代数据化。“大数据”的前提就是利用这些可追溯、可量化的数据,挖掘数据背后的深刻含义。

过去我们通过可移植文档格式,对文本进行数字化,变成了数字形态的档案资料,存入电脑或者网络。但这些数字化的档案资料要查询起来也不便捷。如果这些数字文本能够被数据化,不仅文本中的字、词和段落能够一一被识别,利用搜索引擎加以检索就会方便很多,还能满足管理并遵循存储和存档数据的需求。从某种意义上说,大数据就是所有档案馆现代化必走的一条技术路径。

1.4 智慧档案馆建设既要重“云”和“物”,更要重“数据”和“智”。我们在筹划智慧档案馆建设时,一方面要重视信息基础设施建设发展物联网技术和云技术,更要“拨云散物”见“数据”,因为数据是核心资源,而大数据处理不是靠一台超级计算机,而是靠无数台计算机,通过数学模式将数据分解、合并直至得到结果,且大数据在处理和运用数据的方式上与过去小数据的集合迥然不同,大数据关注的是全部数据,小数据关注的是样本信息;大数据关注的是概率和趋势,小数据关注的是精准度;大数据关注的是关联关系,小数据关注的是因果关系;要注重“以用户为中心”,强调信息在生产、交换和传播中的价值,更要重视大数据分析处理的核心技术,加强档案数据产品创新竞争力,提升智慧档案馆服务能力,因为大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理,通过“加工”实现数据的“增值”。否则智慧档案馆的“大脑”就不够发达,“智商”就不够高,能力就不够强。

大数据不仅是技术变革,更是档案管理与服务领域的变革。大数据将彻底改变档案馆原有的运营和管理方式,一切档案管理都将循“数”管理、“智能化”。在大数据之下,人、计算机、档案的三元大融合真正成为现实。

2 在管理制度上要创新,建设数据标准,首要的是建设基于数字资源生命周期的标准规范体系

标准规范是数字档案馆建设的基础,也是数字资源共建共享的基本保障。为了实现全国各级各类数字档案馆系统的互联互通,首先要统一规则,本着“互联、开放、共享”的原则,围绕数字资源生命周期,构建从资源创建、描述、组织管理、服务到保存各环节的数据标准规范体系,同时围绕核心业务流程如数据的获取、整合、传递、加工、算法等方面建立操作规范,不断优化信息流,以大数据驱动来将“大数据”背后的人与人、信息与信息、人与信息连接起来,将人的需求同各种各样的以信息为基础的东西连接起来,以开放、平等、互联、参与的方式来重构档案服务新模式和管理方式。唯有如此,才能践行互联互通,才能让用户找到数据、存储数据、使用数据,真正变“云”为“雨”。

3 在技术上要注重智慧档案馆的顶层设计,架构智慧档案馆云平台

3.1 要做好顶层设计,方能让档案馆云平台真正成为社会公众身边便捷、高效、不可或缺的信息获取平台。笔者认为智慧档案馆云平台建设要围绕“一个核心系统、两个管理机制、三个支撑框架”的目标来架构:核心系统是存储系统、访问系统、数据分析系统;两个管理机制是数据总线保证在分布式系统里有良好的流动性,调动系统与工作流系统,三个支撑框架是收集、存储框架,运维框架,管理交付框架。其目的是要解决资源共享、自动化管理、数据和信息整合以及业务逻辑的整合问题并降低所有成本。

具体地说,智慧档案馆云平台建设总体框架应为四层:

底层为基础设施层(IaaS[1]平台):主要实现物理资源(包括计算设备、存储设备、网络设备、数据资源等)的集成与整合,采用虚拟化技术“全方位”将其(无论是同构资源还是异构资源)形成一个统一的虚拟资源池,通过云管理平台来进行弹性的调度,看资源生命周期,进行一些分区管理,优化调整系统基础架构,在封装成基础设施层以后,为智慧档案馆提供包括档案存储、传输网络和使用所需的计算资源、存储资源、网络资源和数据资源池。

平台层(PaaS[2]平台):用户不需要管理或控制底层的云基础设施,包括网络、服务器、操作系统、存储等,但客户能控制部署的核心的应用程序,包括接收电子档案、虚拟库房管理、电子档案身份证管理等;也包括控制运行应用程序的托管环境配置,开架系统、开放堆栈等中间件的部署与配置、业务数据库的配置等。

应用层(SaaS[3]平台):主要提供综合业务服务,包括档案数字资源公共利用服务、档案政务服务、档案查询支持服务、电子档案身份证查询服务等,在整合档案云平台层所提供应用软件基础上,以服务的形式对外提供访问入口。

平台层和应用层都可以直接以服务的形式向平台用户提供服务。

顶层为终端用户层:主要是一些端到端的流程服务,流程可随用户需求的不同,可以被定义、被跟踪、被执行、被修改,是很灵活的,用户可以采用各种终端界面访问应用层所提供的服务内容,如提供云档案桌面的呼叫业务、云档案馆访问与存储、云手机访问、云个人数字助理等服务。

总之,基础设施层、平台层最终都是服务,且都是交互方式。该总体框架的焦点在于把现有的多个分布、异构的区域性数字档案馆用户系统(平台)融入一个新的可互操作的“云”中,可以在多个平台之间迁移应用程序并实现操作,支撑各级档案馆之间融通的有效实现。众所周知,没有共享,就没有大数据的优越性,也无法解决个体数据和统计规律的问题。

3.2 实施二步走战略。第一步是建设数字档案馆。数字档案馆是网络环境和数字环境下档案馆新的发展形态,它利用现代信息技术,能很好地处理流逝的业务数据和归档型数据,对海量、分布、异构的数字资源进行整合,形成有序的整体,通过各种媒体提供友好、高效的服务,通过对多个分布式异构资源库的无缝连接,能够方便地实现不同数字档案馆系统之间的用户双向认证和资源双向访问,让人们能够随时随地获取信息和知识,其共享的深度和广度都是传统档案馆所无法比拟的。在此基础上顺势而生,借势而动,开展第二步建设,即建立集“资源多元、全面感知、综合处理、双模存储、泛在应用”于一体的档案及档案馆管理与运营综合支撑平台,也就是建立智慧档案馆。

4 加强数据人才队伍建设,更加注重与社会各界的广泛合作

一是我们要积极招揽、培养和造就一批数据专业人才,不仅懂得用工具,还懂得用数据,以适应智慧档案云平台建设的需要,同时还要借“外脑”,不求所有,但求所用。

二是我们在通过需求牵引、问题导向、案例推理、系统分析等大数据研究流程来建立创新生态系统,不仅要与本市及国内外各系统各类型的档案馆和科研机构通力合作,而且还要与政府部门、企事业机构以及社会各界加强多元化跨领域的合作交流,破解各自为政、“数据壁垒”、数据共享缺失的困境,进一步创新档案信息共享的模式。

三是要充分利用各地区规划建设的其他数字化服务平台,加强与数字城市、智慧城市、数字书屋、科技信息共享平台、数字电视、移动服务等数字化平台的整合,一方面充分利用其网络设施、数字资源和服务渠道,另一方面要按照开放建设的思路,充分考虑与这些平台的对接和高度共享。正如哈佛大学社会学教授加里·金所描述大数据时代那样:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”档案领域也概莫能外。

注释:

[1] IaaS (Infrastructure as a Service),基础设施即服务。

[2] PaaS (Platform as a Service),平台即服务。

[3] SaaS (Software as a Service),软件即服务。

[1]NIST(美国国家标准与技术研究所)关于云计算的定义。

[2]《大数据正在改变你我》(作者沈小根)《人民日报》2014年6月6日第12版。

猜你喜欢
档案馆数字化数字
家纺业亟待数字化赋能
云南省档案局办公室关于表彰2018年度《云南档案》优秀通联组及发行先进单位的通报
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
答数字
全省部分档案馆新馆掠影
数字化制胜
数字看G20
when与while档案馆
成双成对