智慧城市建设中的档案大数据系统研究

2017-08-29 14:56席畅
兰台世界 2017年15期
关键词:数据系统数据源结构化

席畅

(黑龙江大学信息管理学院 哈尔滨 150080)

智慧城市建设中的档案大数据系统研究

席畅

(黑龙江大学信息管理学院 哈尔滨 150080)

本文从信息时代转变档案传统观念入手,对智慧城市构建中的档案大数据系统探究式地加以分析和设计,提出了依照档案实际内容流程搭建高智能基础设施框架理念,实现从海量信息和数据中抽取和挖掘有用的信息和资源,有效扩展档案库藏,并通过档案大数据系统平台的构建,有效提升现代档案管理及档案服务功能。

智慧城市 观念 档案大数据 档案信息资源

智慧城市作为国家现代化水平的重要标志之一,已被列入重要议事日程。就“智慧城市’而言,核心体现为“智能”。未来城市犹如一座庞大的智能机器,像人的大脑一样,具备有效支配、协调和组织各部分相互配合、完成指定任务的功能,同时具备危机预测、预警、自动生成应急预案、采取必要措施的能力,还具备发现和预测各行业未来走势、提出初步方案的能力,并具备预测行业走势、生成指导意见、开展创新和创造的能力等等,体现高度的智能。档案大数据系统作为智慧城市建设的一个重要组成部分,承担着历史传承及推动人类社会发展的重要任务和使命,通过大数据技术,使我们能够做到深入挖掘档案资源、扩展档案库藏,实现有效管理、组织和利用,发挥档案社会服务功能和作用的时代效能。档案大数据系统的建立,必将成为智慧城市建设的重要标志和重要支撑之一。

一、做好建立档案大数据系统观念上的准备

1.建立大数据档案系统需要思维观念的转变。目前的档案管理,依然以传统方式为主,而数字档案资源建设基本上处于探索和尝试阶段。大数据的产生,是数字化时代的必然,有效处理和利用日益增大的数据资源,需要新的模式和技术,并通过新模式、新技术产生巨量的档案资源,为国家、社会和民众服务。这一切必将对档案从业人员思维观念造成极大冲击。面向未来,无论业内决策者或领导者,还是档案馆从业人员,乃至档案研究或教学人员,都必须摒弃观望或保守的消极态度和思维观念,要强化学习,更新观念,开放思维,踏实工作,为加快档案信息化建设进程做好思想和行动上的准备。

2.建立大数据档案系统需要树立正确的开发观念。目前对于档案信息资源开发观念的认识存在三个误区。一是片面强调档案的机要性、保密性,人为抵制档案的开发与利用;二是开发档案资源无用论,认为档案工作不存在技术含量和学问,无需档案资源开发;三是由于资金有限,难于达到档案大数据系统建设要求。档案大数据系统的开发,是强国利民、迈向全面现代化的重要组成部分,时不我待、刻不容缓。我们在转变观念、树立信念的同时,要立足长远、着眼现实,有计划、有步骤地开展工作,扎实有效地推进档案大数据系统开发进程。

3.建立大数据档案系统需要树立完备的安全观念。目前档案工作者缺乏网络安全专业教育,对档案信息安全管理缺乏针对性和执行力。相关政策法规和制度建设及标准化管理、计算机辅助管理等相对档案信息化发展步伐明显滞后。档案作为国家战略决策的重要资源之一,具有丰富内涵和利用价值,同时在档案安全上有其特殊的要求。我们在档案大数据系统建设中,在充分重视增强档案从业人员安全防范意识的同时,要切实加强网络安全设施、安全技术手段及政策法规建设,创造安全的系统环境,为有效开发和利用档案大数据系统创造有利条件。

二、智慧城市建设中的档案大数据系统探究

大数据技术支持巨量的存储与存储处理,使档案资源的统一管理成为可能。档案大数据服务平台的构建应具有异构、开放、移动、协同和融合性等特征。注重用户实际需求,通过构建和整合不同信息资源、网络平台,为用户提供安全的使用环境,实现用户的无障碍利用。档案大数据系统的设计不仅需要解决超大数据造成服务器容量不足问题,同时要把有效降低投资和维护成本融入系统设计理念之中。构建档案大数据系统平台,应按着档案实际内容流程进行设计,应包括档案的数据采集层、数据存储层、数据转换层、数据互联层和数据管理层等五个层面的内容。如图1智慧城市建设中的档案大数据系统结构图。

图1 智慧城市建设中的档案大数据系统结构图

1.档案数据采集层。大数据环境中,档案作为数据的一部分,与传统意义上的档案有着明显的区别。形式表象呈现多样化。而高质量的档案数据和信息获取渠道,不仅来源于已有局域网中的结构化数据,同时能够通过网络交互、传感器、RFID射频、及B/S移动输入等多种渠道获取非结构化数据,实现采集、变更与处理。由影像识别技术获得的动态数据,由扫描、摄影而输入计算机获得的纸质文档,都是由半结构和非结构化数据变更为结构化数据的实际例证,这种做法既便于工作人员查找原始数据,同时也避免重复录入,产生堆积。

采用方法:一是建设基于文档一体化的电子档案管理平台,加强电子档案的接收与管理;二是建设业务数据库采集管理平台,集中管理各单位有长久保存价值的业务档案数据库;三是建设媒体信息采集平台,实现档案馆对网站、广播、电视等媒体信息的智能采集和自动归档;四是建设基于城市记忆理念的数字文献资源收集和管理平台,有计划地大规模积累城市历史文化资源,并通过专用网站提供权威的城市历史文化资源,搭建城市记忆体系。

2.档案数据的存储层。数据存储层是各类异构数据源存储形式的抽象。智慧城市中数据源有多种存储形式,例如关系数据库、半结构和非结构化文档、多媒体数据等,因而数据存储层具有巨量、异构、分散的特征。作为数据存储层,主要有两种数据存储形式:一是存储在各类数据库中的结构化数据;二是以文件形式存储的半结构或非结构化数据。

建立大数据数据源的重要基础是档案的数字化。在做好该项工作的同时,要完善电子文件和档案数字化成果管理服务体系,为服务器集群的数据整合和处理、即大数据处理做好准备工作。

图2 档案数据的存储

3.档案数据的转换层。根据数据过滤和清洗规则,对已经采集到的大数据源实施可用性检查和质量分析,对数据实施过滤与清洗,使数据整合时具有较高的可操作性和价值密度。避免出现巨量数据传输中的拥挤、塞堵及产生冗余空间等现象。

利用云计算的分布式系统制作档案大数据源的转换层,能够具备足够的数据传输和存储能力,达到档案大数据的智能交互,进而构成由方法库、知识库及模型库共同组成的多维数据模型。针对不同的数据类型,数据转换层主要利用两种技术手段:对于结构化数据(主要是指关系型数据)利用RDB至RDF映射技术(RDB2RDF);对非结构化数据(主要是指多媒体数据)利用数据语义标注标签对数据实施RDF标注。

4.档案数据的互联层。档案数据的互联、整合主要体现为采用数据接入技术(包括广域网、局域网、个人网等),将数据采集层已处理过的数据安全、稳定、快速地输送到上层,并通过数据交互功能模块形成档案大数据源共享系统、并具备“智能交互”功能。

档案数据互联包括控制系统、运行引擎,基础平台管理等。控制系统指通过调度、转换、功能等方面对档案数据进行索引和协同搜索,运行引擎指的是对数据对象、数据访问、工作流的引擎和任务引擎的整合,一个分布式文件系统的实现,能够做到经济高效地分析PB级的结构与非结构化数据或信息;基础平台管理包含日志管理、数据访问及访问策略、信息通知、异常处理、缓存管理,是对档案数据按照预定规则存储,并进行库内的科学分析。

5.档案数据的管理层。档案数据管理层面指的是使用和维护系统的接口,包括数据共享、数据维护和数据分析,是数据服务的指挥中心。通过多维分析、数据挖掘和各种查询三个工具实现人机交互界面。通过对人机交互、操作逻辑、界面美观的整体设计,实现登陆与认证、数据存储、数据操作、数据查询、基本参数设计等功能。不管采用何种技术,关键是应用。应用需要的数据才是有价值的数据,只有生成多模式、多样性的应用数据,档案大数据源的价值才能得以充分体现。

智慧城市构建中的档案大数据系统建设是一项长期、复杂的系统工程,还面临着诸多技术与非技术的困难和问题。如何科学、合理地设计和搭建高智能的系统框架,是档案业内人士应该认真思考、认真对待、认真研究的重要课题。未来智慧城市的档案大数据系统,将使档案部门走出象牙塔,成为公众与政府之间的桥梁,这座高智能的桥梁,必将为用户带来全新的体验和收获,为国家全面实现现代化,为人类的发展和进步做出突出的贡献。

[1]席畅.大数据环境下未来档案馆建设的新构想[J].云南档案,2017(1):55-57.

[2]席畅.浅谈互联网+档案信息化[J].黑龙江档案,2016(1):52-53. [3]杨智勇,周枫.面向智慧城市的档案信息服务模式探究[J].档案学通讯,2016(4):44-49.

[4]郝伟斌.面向智慧城市的档案信息化[J].档案管理,2013(4):21-23.

Research on Big Data System of Archives in Smart City Construction

Xi Chang
(Information Management Department of Heilongjiang University,Harbin 150080,China)

Starting from the change of traditional archives concept,this article analyzes and designs the big data system in the construction of smart city,puts forward the idea of building the framework of the high intelligence infrastructure according to the actual content flow of the archives,tries to extract and excavate useful information and resources from the massive information and data,and then effectively expand the archives storage.Besides,through the building of big data system platform,the modern archives management and service function can be effectively enhanced.

mart city;concept;archives big data;archives information resource

G270.7

A

2017-04-07

本文为黑龙江省高校本科科研业务费黑龙江大学专项资金“智慧城市背景下档案信息资源规划研究”(项目编号:HDJDZ201613)阶段性研究成果;教育部人文社科规划基金项目“信息文明视阈下档案文化范式转型研究”(项目编号:12YJA870015);国家社科基金项目“信息文化视阈下档案价值认知转型研究”(项目编号:13BTQ066)。★作者简介:席畅,黑龙江大学信息管理学院2015级档案学研究生。

10.16565/j.cnki.1006-7744.2017.15.05

猜你喜欢
数据系统数据源结构化
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
基于Spark的高速收费站大数据系统的设计与实现
基于计算机软件开发技术的物联网数据系统
Web 大数据系统数据源选择*
非均匀采样数据系统的新型模型描述方法
基于不同网络数据源的期刊评价研究
基于真值发现的冲突数据源质量评价算法