数据挖掘技术在高校图书馆管理中的应用

2017-03-09 16:27张永强
淮北职业技术学院学报 2017年4期
关键词:数据挖掘图书数据库

张永强

(黎明职业大学 图书馆,福建 泉州 362000)

数据挖掘技术在高校图书馆管理中的应用

张永强

(黎明职业大学 图书馆,福建 泉州 362000)

数据挖掘技术现已几乎渗透到了各个领域,图书馆在原来固有的管理模式下,很难对各种信息转换后的数据实行预期目的的分类管理。数据挖掘技术所具有的快速方便和行之有效的独特分析方法,可以使图书馆管理需求得到很好的满足。

高校图书馆;数据库;数据挖掘;管理应用

随着数据库和网络技术的发展越来越成熟,Internet 技术和Web 技术也取得了很大进步,高校图书馆所拥有的各种类型资源量也急剧增长,所服务的对象在信息素质和信息需求也逐步走向高级化,传统数据库管理系统的检索机制和统计方法已远远无法满足时代需要。因此,为解决数据异常丰富,信息非常贫乏的现象,图书馆相关部门可以利用数据挖掘技术构造出表面上庞杂无序的内在联系,最大化开发其所包含的数据资源功能,深挖信息的增值作用,推动服务与技术的变革,以满足服务对象的需求。

一、数据挖掘技术的本质属性

20世纪80年代末美国第一次提出了数据挖掘概念,即在一定的数据资源里通过进一步的挖掘以发现更具价值的信息。数据挖掘也称资料探勘,英文是Data Mining,一般简写为DM,通常指从海量的、有噪声的、不完全的、模糊并且随机的数据当中,寻找人们本来不知道又包含在里面的有价值信息和经验的一个过程。[1]也就是说利用专业工具通过对海量数据自动或半自动的摸索和认识过程,目的是以易于理解的方式呈现其中所隐含的有价值的内在联系。数据挖掘简单的来说就是用算法进行知识发现的程序,所探寻的内容包括:一是广义知识,揭示相同事务性质一样的知识;二是差异知识,揭示相异事务之间不一样属性的知识;三是预测知识,利用已有的记录数据预测出将来的数据;四是特征知识,揭示事务各方面特点的知识;五是关联知识,揭示事务之间互相联系的知识;六是偏离知识,揭示事务与常规不一样的现象。这些知识伴随定义层次的上升将逐渐被挖掘出来,从狭义数据到广义数据,不同对象决策所需。

二、数据挖掘技术较传统数据分析的优势

与早期的数据归纳分析(如图表、检索、联机处理等)对比,数据挖掘技术的最大不同之处是所处理的数据带模糊性和整体性,还有所隐含的关联性,即数据挖掘的过程是模糊的分析和检索,检索到的结果可以是与检索词有关联的任何书目信息,也可以是检索词上的重合书目,或者是之间有关联和重合性的书目。利用数据挖掘技术所发现的结果与常规分析得到的有一定出入,这有利于克服思维定式的束缚,有效拓宽思维领域,发现常规之外的价值信息,做好数据资源的充分整合与利用。

三、数据挖掘的一般过程

数据挖掘是根据业务知识从现存的数据中寻找各种模型,导出结果的一个重复迭代过程。这个流程是几个之间具有相互关联的步骤一直进行重复迭代,常见有定义问题、数据准备工作、选用合适的解决问题指令、提取遵循的法则、结果衡量、利用采用的模式生成知识,直到最后的数据应用。[2]当然由于数据基础和应用需求的不一致,数据挖掘所采用的步骤也会有所出入。常用的数据挖掘步骤是:(1)定义待处理的问题;(2)预先处理数据的准备;(3)选择处理所需的数据 (4)转化成可接受的数据;(5)对数据进行分析;(6)数据挖掘建模;(7)对模型进行评价;(8)挖掘出所需的数据;(9)对挖掘出的数据进行解释。

在挖掘数据时,需要事先明白该应用所需的各种专业知识,在掌握背景知识的条件下,领会挖掘所要达到的效果,确定客户的真正需求。没有相关知识的支撑,很难找出客户要处理的目的,加上数据残缺或不足,想要得到准确的结果就非常麻烦。理清挖掘数据的任务和清楚客户所要处理的问题是数据挖掘首要的一步,也是能否成功的一个关键决定性因素,因此在任务开始前最主要的工作是获得并了解用户的业务知识和数据需求。客户的要求一旦明确后,可以对现存历史产生的数据或其所拥有的资源进行全面衡量,通过掌握的数据挖掘技术解决客户提出的问题,再次明确挖掘数据的目的和其相对应的计划。

四、数据挖掘技术在高校图书馆管理中的运用

(一)数据挖掘技术服务图书馆藏书建设

生活在快节奏的现代社会中,人们对时间越发显得珍贵,图书馆所服务的对象也希望能得到更具有针对性的、实用性强的服务,从而大大节约读者的借阅时间,降低时间成本,最终达到提高借阅者的满意度,这也是当前各大图书馆所追求的目标之一。图书馆提供什么服务,读者就享受什么服务的管理模式已无法满足当前实际服务的需要。近几年开展的差异化或个性化特色服务越来越受到读者的酷爱,这种独特的管理理念,在目标、过程和行为等几个方面来满足个体的服务已逐渐成为图书馆发展的未来趋势。利用数据挖掘技术代替人工劳动,从繁杂的重复事务中解脱出来,对各种数据进行归纳整理、分析提炼,使图书馆的各种使用功能得到充分发挥,实现智能化的管理与服务。数据挖掘技术被利用在图书借阅情况的关联规则时,首先通过自动化管理系统查明某本图书的借阅情况,搜索借阅该图书同时又借阅另一图书的情况,假如这两本图书被借阅的比例较高,则这两本书在程度表现上有着较强的相互联系,在以后图书馆管理系统推荐图书时,可以同时介绍这两本图书,将大大节约服务对象查询自己所需图书的时间,提高服务对象的满意度。

(二)数据挖掘技术服务图书馆藏书的采购

图书馆作为一个公益服务性的单位,经费比较紧张,高效的使用拨款经费是当前图书馆界存在的一个重要问题。[3]图书馆采编相关人员可以利用数据挖掘技术统计出馆内先前的检索请求情况或检索命中情况、文献资源的使用状况,例如使用序列分析方法处理数据,分析图书馆各资源的使用状况,为馆内资源购买提供合理的建议或报告,使图书馆建设朝着智能化图书采购的方向发展。所以,图书馆采购管理中如能利用好数据挖掘技术,针对性的补充图书馆文献资源,有限的采购经费配置得到优化,对采购任务要科学统筹区分轻重缓急,保证将有限的经费用到真正发挥效用的地方。

(三)数据挖掘技术服务图书馆的信息整合

首先,图书馆工作平台可以利用数据挖掘技术完成各种图书借阅情况的统计剖析,容易寻找出高借阅率的图书,也能使匮乏的文献资源得到快捷的弥补,同时也可以方便下架一些陈旧跟不上时代的图书,馆内各种图书之间达到合乎理性的比例,更好解决馆藏资源优化问题。其次,馆内对其近年来的借阅数据可充分利用数据挖掘技术,针对那些高借还频率的图书资料在流通前根据挖掘结果对它们预留必要的副本,进一步扩展馆内的文献保障能力。最后,在图书馆馆藏体系建设过程中利用数据挖掘相关技术,把WEB系统的智能搜索功能与外界的互联网紧密联系起来,实现数据融合,合理发挥出信息科学的优势,实现信息找人的目标。

(四)数据挖掘技术在小型院系数据库的应用

在一些高校中,不仅有为全校师生读者提供馆藏服务的总馆外,二级院系还有自己的专业分馆或院系资料室,收存与自己院系专业有关的文献资料,为自己所在的院系师生提供文献服务,方便院系里师生使用其本专业相关的文献资料。图书馆在读者办理借书手续时会记录下读者的相关信息,如学号、姓名、院系、借还时间等,管理系统为各个读者建立自己相应的个人书架。从入学到毕业,一位读者的借阅量有几十或几百甚至几千本之多,个人书架不断增加的过程中系统都会一一的记录下来。一个专业有的一个班,有的几个班,如把每届毕业生的个人书架进行汇总就是一个小小的图书馆,俨然是独立的数据库了。利用数据挖掘的分类分析和聚类分析手段,形成各专业对应的图书借阅数据库,按照各种排序方式得到不同的结果,如借阅量高到低、使用时间长到短等。[4]对于各专业的图书借阅数据库,为每年新来的同学提供借阅参考数据。随着时间推移,数据库的记录数不断得到增加,当时间和图书积累到一定程度时,数据库所含内容将会与总馆这个专业所含的内容接近,这时需要对这些数据进行剔除更新。一些图书受出版时间影响较大,在出版入市的前几年里很受欢迎,但随着社会和科学技术的进步,一些图书不再适应专业的需要,慢慢的减少借阅这些图书,这时需要对这相对过时的图书数据进行剔除更新,使数据库保持精简新颖,从而更好地为专业师生服务。

五、当前数据挖掘应用的困境和展望

数据挖掘作为一种新型数据分析手段,已受到各行各业的认可和接受,目前主要应用在CRM的发展趋势、物品交易和市场走向的预测[5]。随着数据挖掘给人们生活带来各种改变时,也随之产生了一些技术方面的误解,同时在实际应用中也碰到了许多问题。

(一)数据挖掘应用的困境

往往对数据挖掘技术有很高的期望,而忽略了数据挖掘有其自身的局限性,认为只要利用了数据挖掘技术就能解决所有的问题,其实还要看所期望的结果与数据之间的关系。有些人认为数据挖掘技术是千篇一律的定型工具,对不同数据源的挖掘算法不尽相同,并非所有行业都用同一套算法。对算法的理解,不同的人有不同的理解,甚至是片面的,这导致了数据挖掘无法发挥其应有的作用。在数据挖掘所经过的步骤中,数据准备工作量大,分析建模比较复杂过于繁重,模式里的算法参数选取对挖掘的效果有着重大影响,这就要求在挖掘的各步骤中不断实验,探寻出最合理的参数,才能顺利圆满完成预定的任务。[6]

(二)数据挖掘应用的展望

虽然在应用中碰到了许多困难,但都在努力使其往好的方向改进。随着计算机及数据库技术的不断发展,新推出的数据挖掘系统和挖掘方法也会愈来愈多,高校图书馆借助数据挖掘技术进行管理与决策的探索也将更上一层楼。

[1] 杨红霞.基于数据挖掘技术的图书馆管理[J].科技情报开发与经济,2011,21(12):75-77.

[2] 邢新.数据挖掘技术在高校图书馆管理的应用分析[J].管理学研究,2013(4):47.

[3] 陈晔,董岩.数据挖掘在图书馆管理方面的应用[J].内蒙古民族大学学报(自然科学版),2016,31(3):206-208.

[4] 叶艳.基于数据挖掘技术的高校图书馆个性化服务[J].兰台世界,2016(6):58-60.

[5] 田玉娥.数据挖掘在图书管理方面的应用[J].电脑开发与应用,2012,25(4):79-81.

[6] 邹昕.数据挖掘在图书馆管理中的理论与技术[J].科技视界,2016(8):12-13.

责任编辑:仲耀黎

Application of Data Mining in University Library Management

ZHANG Yongqiang

Data mining has almost penetrated into all fields. In the original form of management,it is difficult for libraries to implement the classified management for the intended purpose of all kinds of data after information conversion. The unique analysis method of data mining is fast,convenient and effective,and it can help meet the requirement of library management.

university libraries; database; data mining; management application

2017-04-10

张永强(1980—),男,福建泉州人,工程师,研究方向:图书馆数字化和计算机技术应用。

G251

A

1671-8275(2017)04-0139-03

猜你喜欢
数据挖掘图书数据库
探讨人工智能与数据挖掘发展趋势
图书推荐
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
欢迎来到图书借阅角
班里有个图书角
数据库
数据库
数据库
数据库
一种基于Hadoop的大数据挖掘云服务及应用