基于大数据的高校信息资源共享库构建探索

2017-03-27 18:20陆大同姜思佳
广西教育·C版 2017年1期
关键词:信息资源构建大数据

陆大同 姜思佳

【摘 要】本文阐述高校信息资源共享的历程与现状,分析大数据时代高校信息资源共享的必要性和可能性,以及高校信息资源共享库建设所需的条件和制约因素,从构建原则、服务模式、实现路径、发展趋势等方面探索基于大数据的高校信息资源共享库的构建。

【关键词】大数据 高校 信息资源 共享库建设 构建

【中图分类号】G 【文献标识码】A

【文章编号】0450-9889(2017)01C-0055-04

高校作为社会发展信息资源的传播者和开拓者,在社会发展的信息化背景下,必然要实现信息资源的共享,以使高校发展与时俱进。因此,基于大数据的高校信息资源共享库的构建成为高校未来发展的必然趋势。高校信息资源共享库的建设不是简单的技术堆积,而是需要通过高校一系列变革和转变来实现。基于此,本文以大数据背景下的高校信息资源共享为切入点,详细分析和论证高校信息资源共享库建设的诸多影响因素,以期为高校信息资源共享提供有力的理论支持。

一、大数据简介

随着云计算、物联网等的发展,以信息为基础资源已经成为社会、机构、团体等发展的必要元素。无论是学者还是机构都肯定了大数据为人类所带来的好处。

从“大数据”字面意思而言,大数据所表达的语义是抽象而模糊的。“大数據”本身仅仅表示数据规模的庞大。这种庞大是针对数据的数量规模而言,与“海量数据(massire data)”或者是“超大规模数据(very large data)”等诸多人们耳熟能详的概念并没有明确的边界和区别。一些学者针对大数据本身的特点称之为“3V”的大数据定义,即称之为大数据必须满足规模性(Volume)、多样性(Variet)以及高速性(Velocit)。以此为基础,一些学者通过研究提出了“4V”的大数据概念。但针对“4V”这一概念学者认识不尽相同。国际数据公司(International Data Corporation)针对海量数据的资源性特征和有效数据的稀疏性特点提出,大数据应该具有价值性(Value)。IBM则认为大数据因其应用范围广阔且影响重大应该具备真实性(Veracity)特征。其实,无论大数据定义本身如何被归纳和总结,其方向性均指向规模庞大的信息资源。

二、高校信息资源共享的历程与现状

(一)高校信息资源共享的历程。高校信息资源的共享,从新中国成立以来经历了尝试阶段、摸索阶段和发展完善阶段。

1.尝试阶段。1957年,国务院颁布了高校图书馆信息资源的协作方案,这也是高校信息资源共享的开端和尝试。该方案受限于当时的技术条件,以狭义信息资源的概念,针对各个高校图书馆之间的协作予以规划和设计。随着各个研究领域中对于信息资源广度和深度的要求越来越高,高校图书馆信息资源共享这一概念被提出,并创建了图书馆信息资源的协作机制,高校信息资源共享开始初步尝试。

2.摸索阶段。这一阶段是改革开放以后的20世纪80年代和90年代初。经历了高校图书馆信息合作的前奏,传统国家级范围内的馆际协作信息共享、地方性馆际协作信息共享以及行业系统性馆际协作信息共享机制得以建立。为了适应社会经济和科技的发展,在以信息使用者为中心、以学习为导向的现代服务理念推动下,中国高等教育保障系统(CALIS)、科技部和中科院等部委的国家科技图书文献中心(NSTL)等机构相继成立,使得高校信息资源的共享开始产生了广度和深度的变化。

3.发展完善阶段。20世纪90年代后期,信息资源是国家重要战略资源,而高校是国家信息资源的存储、累积、开发和利用水平提升的重要力量。高校信息资源共享以信息科学技术发展为基础,需要走向信息占有能力的建设、知识储备能力的建设以及科学技术能力的建设三个方面,因此,1997年我国首次信息化工作会议在深圳召开,并确立了中国信息化建设的24字方针,即“统筹规划,国家主导,统一标准,联合建设,互联互通,资源共享”。随着这一信息资源共享建设方针的提出,依托于迅猛发展的电子信息技术,高校信息资源共享的形式、内容和范围开始逐步扩展和纵深化发展。至此,我国高校信息资源共享走上了真正意义上的发展完善阶段。

(二)高校信息资源共享的现状。具体如下:

1.信息资源共享基础设施建设和信息资源利用率低造成资源浪费。高校间资源共享是构建在信息资源共享基础设施建设的基础上。高校通过配备服务器、网络和存储等基础设施实现信息资源的共享。但网络电子技术基础设施的共同特征是更新换代快。一旦信息资源利用率低,势必会造成资源的巨大浪费,使数据中心建设成本大幅度增加。

2.信息资源建设缺乏统一标准导致“信息孤岛”现象频繁发生。当前的高校信息资源建设标准并没有在全国范围内实现统一,使得数据异构、格式冲突、较差的可扩展性和通用性现象层出不穷,一些优质资源很难实现缺乏开放互操作接口条件下的共享。

3.信息资源分布不均,导致资源使用效率低下。我国高校信息建设水平受制区域、高校自身条件等多方面的限制,信息资源共享建设良莠不齐。知名高校丰富的优质信息资源只能提供给有限区域内的少数人,普通高校则缺乏信息资源共享的渠道和机制,这导致我国高校信息资源共享呈现一方面优质信息资源被限制而浪费,另一方面又缺乏优质信息资源的现象。

4.信息资源建设成本高,运营维护管理难度大。高校在对信息资源基础设施的建设投入大量财力、物力和人力的同时,还要面对运营维护管理的专业性难题。因此,各个高校面对信息环境复杂多变的状况时,其系统安全以及稳定性缺乏保障。

三、大数据时代高校信息资源共享的必要性和可能性

(一)大数据时代高校信息资源共享的必要性。大数据时代的高校信息必然依托于网络,因此在内部以及外部实现资源共享的必要性主要有以下几点。首先,针对互联网技术的不断成熟,高校信息资源在大数据时代已经拥有了可靠的技术保障。数字化技术、数据库技术、网络通信技术、多媒体技术和超文本技术等,已经广泛应用于高校的课堂、管理等诸多领域。即使针对高校内部人们的工作、生活、休闲娱乐等也可以通过大数据的整合,获得这些信息背后所蕴含的高校整体文化内涵等。其次,高校大数据信息资源共享有利于提升教学质量、科研质量等,是中国高等教育水平的基础保障之一。最后,大数据时代高校信息资源的共享是保障高校成员(包含学生、教师、员工、科研院所等)知情权的前提。

(二)大数据时代高校信息资源共享的可能性。大数据时代高校信息资源共享其本质是信息技术与现代管理理念的融合,其目的则是通过网络工具,以用户利用为灵魂,整合高校间信息资源,满足公众信息资源需求。

高校的信息资源其价值主要体现在,高校基于一定的社会理性,以传播和发现社会发展进步的实践为己任,并通过信息资源的整合为人类文明的推进做出贡献。拥有资源并发挥其价值,高校信息资源才具有时代先导作用普遍价值。因此,决定着信息资源价值的信息本质因素,是体现高校信息系统联系机制,并作用于高校内部和外部联系的关键性要素。当这一要素实现共享,高校信息资源和信息资源价值才具有社会性。

如果高校输出的信息资源并不为公众所需要,那么基于大数据时代的高校信息资源形同鸡肋,可有可无。但无论是国家还是团体,其成员参与政治、经济、社会和个人活动的过程中不可避免地享有知情权,其对于信息资源价值的需要是成员社会活动的基础和原动力。因此,高校信息资源不但为社会所需要,同时也为公民所需要。以知情权理论来看,只有公众团体或个人通过知情权获得了更多的信息资源价值,其承受能力和辨析能力才会增强,抵御外界干扰和考验的能力也就越强。由此可见,社会需要、公众需要以及高校自身互通有无的需要,依托于當今的电子信息技术,完全有可能实现高校信息资源的共享。

以电子信息技术为基础实现高校信息资源共享,所提供的信息资源价值必然地以公共物品的形式呈现给需求者。如同公共物品的公共价值其共享程度越高、范围越广,其价值就越是能够得到最大限度的发挥。电子信息技术条件下,高校信息资源普遍以电子数据形式存在,其独立于物质载体的存在形式促使其交易仅仅表现为载体的转移。因此,高校信息资源的任何使用者都能够通过信息载体的转换获得信息价值,而这一转换并不会影响高校信息资源本身的使用价值和效用,由此实现了高校信息资源价值的最大化利用的可能。

如前文所述,高校信息资源是庞大的原始信息资源的集合,信息价值会生成各类文件,这些文件从形成、保存和长久利用都需要一体化管理的方式和手段,因此澳大利亚档案学者弗兰克·阿普沃德等人提出的文件连续体概念,为我们指明了电子文件各阶段的关联性、相互影响性以及相互转化的可能性。电子文件本身没有改变文件的客观运动和形成过程,但通过信息资源共享,任何电子文件所展示的生命周期,都需要在其有效时间段内发挥最大价值。而高校本身所担负的文化传播使命、知识累积和创新使命等,和文件连续体理论相得益彰,因此,只有在电子信息化条件下,通过高校信息资源的共享,才能实现人类文明的快速进步和发展。

既有理论作为高校信息资源共享的铺垫,又有电子技术作为高校信息资源共享的基础,高校信息资源共享已经具备了完全的可能性。

四、高校信息资源共享库建设所需的条件和制约因素

(一)高校信息资源共享库建设所需的条件。高校信息资源共享库的建设毋庸置疑需要在人力资源、物质资源以及技术资源方面着手。以当前大数据的发展水平来看,这三方面都已经达到了高校建设信息资源共享库的外部条件。但目前一些高校仍旧缺乏信息资源共享库,其信息资源共享库建设的内部条件仍旧缺乏。主要体现在以下几个方面:

1.转变思想是打破信息资源壁垒的首要因素。封闭保守的服务理念是限制高校信息资源共享库建设的无形制约因素。打破这一壁垒限制,需要各个高校领导层具有前瞻意识,并能够通过意识的转变,实现信息资源使用者至上的理念。

2.建立统一管理机构和制度是实现共享库建设的必要条件。我国高校隶属于不同地方的不同部门进行管理。体制分工造成高校图工委等机构虽有权掌控信息共享库,但没有行政管辖的权力。因此高校间协作能力差是不争的事实。只有通过建立统一的信息资源共享库管理机构才能解决高校与高校之间、机构与机构之间的协调问题。

3.采取协同化服务模式解决高校信息资源的搜集、整理、收藏和流通问题。传统高校图书馆信息资源共享模式已经不能适应当前快速膨胀的信息资源增长需要。因此,需要转变传统“我有什么,就为用户提供什么”的观念,代之以“用户需要什么,我就能够提供什么”的观念。这一观念转变是信息资源共享库应用成功的先决条件。

(二)制约高校信息资源共享库建设的因素。随着大数据网络技术的发展,高校信息资源共享库建设外部条件已经成熟,信息资源共享库建设的制约因素主要来自高校内部。体现在以下几个方面:

1.传统思想束缚了分工协作。传统高校信息资源的管理是以各个高校为独立核心,无论是行政规划制度还是信息资源共享的理念,都秉持着“人有我有,人无我无”的大一统思想,这一思想束缚了分工协作实现的相互取长补短、相互弥补不足的发展模式。

2.组织缺失无法建立信息资源共享库管理权威。由于高校之间没有单独的组织或部门针对共享库进行管理,松散的管理协调状态使得信息资源共享库的建设成为应景的形式操作。同时,高校间的协作关系不具有严格的约束性,所以没有组织管理的情况下,高校信息资源共享仍旧停留在概念和形式的阶段。

3.信息化管理模式缺失。由于传统行政管理体制的僵硬,无法适应以用户需求为导向的资源管理与服务,因此简单照搬国外的先进经验,往往不参考国内实际状况,造成画虎不成反类犬的尴尬境地。

4.机会主义与合理机制之间产生冲突。缺乏共享库建设的共同发展目标,造成一些高校表面上形成了信息资源共享合作模式,但实际上却是不同高校间合作机构在发展规模、水平和管理模式上存在较大差异,合作者自行其是,以自身利益获得为第一目标,最终使得信息资源共享库建设失败。

5.高校各行其是很难建立统一的共享库标准。各个高校以自身利益获得为第一目标,各行其是进行共享库建设,由此造成各个高校依据自身能力在硬件、软件等设备采集、制度制定等共享库建设过程中出现不应该产生的检索系统不一致、进入接口不一致、高中低档服务器参差不齐等多种后果,使得空有建立信息资源共享库的理念,却因为硬件和软件的限制难以成为现实。

五、基于大数据的高校信息资源共享库的构建

(一)基于大数据的高校信息资源共享库的构建原则。以大数据为背景的高校信息资源共享库建设的必要性和可能性都指向了标准化和规范化;有序、全面和系统化、功能性;易用性;安全性。这四点信息资源共享库的构建指向正是高校信息资源共享库构建的原则。

1.标准化和规范化原则。高校信息资源就其文字或图像等表现形式本身而言没有什么价值,但信息资源表现形式背后的知识性是其价值的核心。因此,高校信息资源的知识性必然要求信息资源共享中必须实现标准化和规范化以实现资源需求者对于知识的理解和认识。

2.有序、全面和系统化、功能性原则。随着科技的不断累积和进步,跨学科、跨专业、跨领域的相互渗透性研究越来越广泛。高校作为信息资源广度和深度的发源地,在信息资源共享过程中应有序地做到信息资源公开、共享同时又不违反国家法律、法规;全面做到可公开信息资源的相互无缝对接,开放式访问无障碍;功能性则强调易于电子信息的检索、查阅和调用;系统化则应该实现信息资源在各系统知识领域内或跨领域外有效的分类、归纳和总结工作。

3.简单易用原则。体现信息资源数据处理能力的高效性,查询功能强大,操作界面简单明了,易学易用。

4.安全性原则。安全性是信息资源共享基础性保护工作。以法律法规为基础、高校信息资源共享原则为指导方向,实现信息发布者和使用者以及信息资源本身的安全。

(二)基于大数据的高校信息资源共享库的服务模式。基于大数据的高校信息资源共享库的服务模式主要依托于环境、政策、数字化、人才,最终实现信息资源共享库的服务模式。

环境是指信息技术与信息环境不断成熟的条件下,由计算机、网络信息技术和社会信息环境构成高校信息资源共享的基本服务模式。信息存储空间的不断扩大、服务器功能的不断提升、信息安全防护技术的不断改善为高校信息资源整合和共享提供了技术基础和保障。信息环境的日益多元化(文献资料、QQ信息等)则为高校信息资源提供取之不尽的信息源泉。两者结合实现了高校信息资源的价值能力和共享的范围。

政策环境是我国不断完善的信息公开与透明的环境建设。2008年5月《政府信息公开条例》颁布以来,受到办公自动化等的诸多影响,一系列政策法律法规相继出台,使得高校信息资源共享获得了模式建设的根本条件。

数字化是信息技术的表现形式,其海量的数据规模为信息资源共享提供了深度和广度的纵深化发展。

人才是高校信息资源共享的信息创造者、维护者。以大数据定义来看,必须通过人才的把关对大数据实现规模性、多样性、高速性、价值性、真实性进行筛选、归纳、总结和预处理。

基于以上可见,高校信息资源共享的模式需要高校、国家、公众团体和个人及电子信息技术共同构建,才能实现信息资源共享的有效性、连续性和公益性。

(三)基于大数据的高校信息资源共享库的实现路径。基于大数据的高校信息资源共享库的实现路径有赖于基础物理设施硬件、开发与应用平台、资源整合层面、应用层面以及访问层面的协同运行。

基础物理设施硬件是指高校信息资源共享库建设的基本设备需要。主要有服务器集群、网络设施、高性能存储集群等。以此为基础预留基础设施服务(IAAS)的方式向上的可伸缩物理资源。

开发与应用平台是指以大数据各类服务方式上提供上层应用程序开发环境、运行环境、数据库环境等。通过类似API的服务模式对分散资源和服务进行整合,为用户提供具有新价值的Web服务。

资源整合主要实现各类元数据库、索引库的构建。应用操作系统借助于一系列标准化辅助工具实现。生成转元数据的基础上,对元数据进行编辑、转换、导入、导出等各类操作。各种高校分散、异构的多媒体素材、网络课程、视频等各类信息资源在标准化的基础上,形成统一的信息资源视图,从而实现高效信息资源的简化。由于是本着大数据基础上高校信息资源共享的目标,因此,如前文所述的高校信息资源共享库中的标准化和规范化原则在这里得以充分地实现。

应用层面要实现信息资源管理和应用服务两个层面。以管理为调控和调度中心,以用户需求进行信息资源的安全和高效配置。

访问层面要实现用户自助服务和大数据平台管理两个方面。用户通过互联网访问规则接入个性化大数据服务方式,系统自动实现身份认证和系统管理。以云中大数据库的模式为例,当用户通过各种软硬件获取信息资源服务时,应用程序均存储、运行在云中。在不以本地计算机为主要运行设备的条件下,尽管用户没有高端设备,但是依然能够利用各类移动终端进行数据访问。

(四)基于大数据的高校信息资源共享库的发展趋势。以目前的高校信息资源共享的大数据技术发展状况来看,高校间、高校与研究机构间、高校与社会之间的信息资源共享会成为高校信息资源共享库发展的未来趋势。随着高校信息资源共享库建设的逐步完善,市场经济发展必然要求高校能够和其他机构间产生合作、共赢的关系,以使未来信息资源之间跨领域、跨专业等的发展获得纵向和横向的进一步深化和提升。

由上可见,大数据背景下高校信息资源共享库的建设问题,已经不单纯是高校之间信息资源共享的问题,而是关系到国家、民族发展高度的全局性问题。因此,高校信息资源共享以大数据技术为背景的基础上,各个高校必须及时地转变观念,打破大学间的信息资源共享壁垒。无论是技术壁垒、软硬件壁垒还是管理体制与机制的壁垒等,都需要以占领国际最前沿科技力量为理念,实现高校间的信息资源共享。实现这一目标不但有利于中国社会的发展,也有利于全人类社会文明的进步。

【参考文献】

[1]肖希明.文献资源共享理论与实践研究[M].南宁:广西教育出版社,1997

[2]周枫.资源·技术·思维——大数据时代档案馆的三维诠释[J].档案学研究,2013(6)

[3]周林兴,周振国.面向社会的档案信息资源规划实现机制研究[J].档案学通讯,2013(5)

[4]周枫.大数据时代档案馆的特征及发展策略[J].档案与建设,2013(8)

[5]赵生辉,朱学芳.我国图书馆、档案馆、博物馆数字化协作框架D-LAM研究[J].情报资料工作,2013(7)

[6]李东,过仕明.我国高校数字博物馆建设探索——以哈尔滨师范大学博物馆为例[J].现代情报,2013(6)

[7]杨茜茜.档案、图书、博物馆三馆信息资源整合研究[J].浙江档案,2013(4)

[8]马仁杰,谢诗艺,理文.论高校档案馆创新型人才培养实习基地建设的途径、机制及规律[J].大学图书情报学刊,2013(2)

[9]程結晶.云技术中数字档案资源共享与管理体系的构建[J].档案学研究,2013(1)

[10]赵雪芹.档案数字资源发现服务研究[J].档案学通讯,2013(1)

[11]秦雪平.图书馆、档案馆与博物馆数字资源整合研究——以世界数字图书馆为例[J].情报探索,2013(1)

【基金项目】广西中青年教师提升项目“基于云平台的高校数字教育资源共享共建模式研究与实践”(KY2016LX547);广西职业教育教学改革项目“信息技术与教育教学深度融合研究——以广西高职教育为例”(桂教职成[2016]);广西职业教育教学改革项目“百色职业学院与柳州五菱汽车工业有限公司订单式人才培养模式探索与研究”(桂教职成[2015]);广西高等教育教学改革工程项目“薄弱高职院校教学团队建设改革实践与研究”(2012JGA418)

【作者简介】陆大同(1969— ),男,广西百色人,百色职业学院副教授;姜思佳(1981— ),男,黑龙江哈尔滨人,柳州城市职业学院讲师。

(责编 卢 雯)

猜你喜欢
信息资源构建大数据
关于构建党校图书馆中信息资源的共建与共享方案
谈云计算与信息资源共享管理
基于网络的信息资源组织与评价现状及发展趋势研究
环境生态类专业大学生创新创业能力培养体系的构建与实践
构建游戏课堂加强体育快乐教学的探究
共情教学模式在科学课堂的构建与实施研究
基于大数据背景下的智慧城市建设研究
网络信息资源检索工具和技巧