试论数据挖掘技术在图书馆管理信息系统中的应用

2018-07-14 08:20高跃峰
神州·上旬刊 2018年7期
关键词:数据挖掘技术读者服务图书馆

高跃峰

摘要:随着我国教育事业的逐渐完善,图书馆作为人们获取知识的一个重要途径受到了各界人士的高度关注。基于此,本文主要针对数据挖掘技术在图书馆管理信息系统中的应用流程、关联规则挖掘、读者服务和应用效果进行分析,进一步明确数据挖掘技术的主要功能,更好地发挥出科学技术在教育事业中的应用效果,希望为我国图书馆管理信息系统的完善提供参考依据。

关键词:数据挖掘技术;图书馆;读者服务

前言:

近几年来,我国正逐渐走向信息化的道路,数据挖掘技术作为一项专业化的信息处理技术备受关注。众所周知,我国图书馆藏书量较大,并且每一天都随着世界的变化而在不断更新,需要处理的信息量也持续攀升。基于此,在图书馆管理信息系统中充分利用数据挖掘技术是非常必要的,进一步改变传统的手工加工管理时代,从而提高图书馆信息管理的整体水平。

一、数据挖掘技术的功能

数据挖据技术是一种新型的信息化处理技术,其主要原理是对工作中产生的大量数据资料进行分析,并且在分析的过程中发现隐藏在数据中知识和规律,最大限度的发挥出数据的重要作用,为相关人员在工作的过程中节省大量的时间和精力,便于他们更加直接的获取到自己想要的信息[1]。目前,科学家将数据挖掘技术按照其功能划分为两个方面。一方面进行预测性数据分析,在资料初步分析信息结论的基础上,对其进行未来预测,主要包括分类型数据预测和统计回归型预测两个部分。另一方面进行描述性数据分析,主要是指对已经收集到的资料信息进行系统化的描述,在与预测性数据分析相结合的基础上,更好的进行海量数据的分类。

二、数据挖掘技术在图书馆管理信息系统中的应用

(一)应用流程

在实际的图书馆管理信息系统运行过程中,数据挖掘技术主要是通过“选择挖掘工具—收集处理数据—数据库挖掘—数据分析总结”这一流程步骤实现应用的。具体来讲:

在进行“选择挖掘工具”的流程环节时,人们通常选择“SQLServer2005”所谓数据挖掘的软件工具。与传统的数据挖掘工具相比,“SQLServer2005”整合了“T-SQL”事务处理模块、“CLR”通用语言模块、数据加密模块、“SMTP”邮件模块、“HTTP”终端模块等多个功能模块,具有极强的优势特点和应用价值;其后,便可通过操作“SQLServer2005”软件工具,实现基本数据的采集和处理。在这一过程当中,相关人员首先要从软件服务其中找到相应的信息表格,并对表格中存在的不对称、不完善问题进行优化补充。在达成表格信息的完善之后,便可启动“SQLServer2005”工具,对表格做出进一步的技术处理,使表格信息更加便于分析和管理;再后,便可进行“数据库挖掘”环节的相应操作。对于这一环节,相关人员一定要提起足够的重视,严格按照软件工具的技术步骤实施挖掘,以此保证数据挖掘的准确、高效[2];最后,即需要对挖掘出的信息进行分析处理。

(二)图书关联规则挖掘方面

1.数据准备及处理

图书关联规则挖掘前,应做好数据准备,并对数据进行预处理。数据准备过程需要的数据,包括书籍名称、借阅次数等内容。数据预处理方法,包括空值处理、噪声处理、数据集成三种方法。以噪声处理为例,影响数据挖掘结果的数据,既“噪声”。如未给予处理,随借阅次数的增加,重复统计的现象较容易发生。为避免上述问题,应根据读者条码的不同,完成预处理工作。

2.挖掘过程及结果

图书关联规则的挖掘过程如下:(1)生成事务集:图书借阅过程中,借阅者的支持度,是决定挖掘效果的主要因素。为提高挖掘效率,应首先将支持度低的纪录删除。选择支持度较高的事务,将其作为样本,挖掘关联规则。(2)最小支持度:最小支持度是决定挖掘效率的主要因素,因此,为提高数据处理效率,确定最小支持度指标是关键。(3)挖掘算法:可将Apriori算法,应用到关联规则的挖掘中,用以获取关联结果。当挖掘结果为10—20时,表明图书较为活跃。当挖掘结果处于10以下时,则表明图书活跃度较差。根据上述关联结果的数据,有关人员既能够得到最终的图书关联规则挖掘结论。

(三)读者服务方面

数据挖掘技术可以提升图书馆管理的水平,在信息系统中应用数据挖掘技术一个显著的优势是提升了对读者的服务效果。一般来说,现代图书馆的藏书规模往往在10万甚至百万册以上,如此规模的图书,依靠纸质信息进行记录和管理势必存在困难,当读者进入图书馆查找图书时,也存在困扰。应用数据挖掘技术,可以将所有图书进行编号,以不同内容为标准进行分类,在大类别下设置小类别,直到所有书籍实现编号的精细化。

(四)应用效果

为了检验数据挖掘技术在图书馆管理信息系统中的应用效果,可采用如下方法对系统进行检验:表单检测:表单内容是管理员、读者使用图书馆管理信息系统的媒介,其测试内容包含标题栏功能测试、TAB键测试系统是否需要设置ESC(全屏退出)、标题输入功能以及列表间距是否合理等。系统链接测试则需要评估导航条、静态信息链接的准确性、系统各页面链接的准确性以及图书链接的准确性等。数据库测试需通过对单元、系统及集成状况的测试,评估图书馆管理信息系统运行过程中是否会出现错误输出或一致性错误。

经过上述测试项目的多次重复测试后,基于数据挖掘技术的图书馆管理信息系统测试结果表明:该系统的功能均可正常运行,系统各页面链接正常,系统登录反应、链接显示反应速度较快;读者可通过对图书馆管理信息系统的便捷操作,掌握图书馆的图书上架信息,而系统则可根据读者的检索记录、借阅记录自动为其推荐相应类型图书;管理员可利用该系统获取读者的阅读需求,并制定适宜的图书馆资源管理方案。

结论:

综上所述,与其他技术相比,数据挖掘技术的描述性数据分析功能、预测性数据分析功能为其在图书馆管理信息系统中的应用奠定了良好的基础。在圖书馆管理信息系统中引入数据挖掘技术,可有效促进图书馆管理信息系统功能的强化,使其为图书馆管理工作带来更多的便捷。而从读者层面来讲,该技术的引入可以提高读者的满意度,间接促进图书资源价值的发挥。

参考文献:

[1]张昕.数据挖掘技术在图书馆管理信息系统中的应用[J].湖南城市学院学报(自然科学版),2016,25(05):63-64.

[2]徐德俊.数据挖掘技术在图书馆管理信息系统中的应用[J].黑龙江史志,2015(05):266-268.

猜你喜欢
数据挖掘技术读者服务图书馆
图书馆
现代图书馆读者服务工作发展的新趋势研究
浅谈信息时代高校图书馆读者服务的变革