数据挖掘在统计工作中的应用前景分析

2017-06-22 11:22赵慧
科技资讯 2017年14期
关键词:数据挖掘技术统计工作应用

赵慧

摘 要:社会经济的迅猛发展,使得统计工作越来越重要。面临庞大的统计数据量和提升数据质量的要求,结合数据挖掘的功能、特点和优势,使得数据挖掘技术应用到统计工作中将发挥更多潜在的功能价值,因此将数据挖掘技术应用到统计工作中就显得尤为必要。该文主要分析了数据挖掘与统计学的关系,阐述了统计工作中应用数据挖掘技术的适应性,对数据挖掘技术在统计工作中的应用前景进行了相关研究。

关键词:数据挖掘技术 统计工作 应用

中图分类号:TP311.13 文献标识码:A 文章编号:1672-3791(2017)05(b)-0007-02

随着信息社会的高速发展,大数据、物联网、云计算的兴起与普及,信息产生和传播的速度与数据量迅速增快,在政府统计工作中,能够通过信息手段从庞大的数据量中获取更多更有效的信息,成为一个国家提升国民竞争力与国民素质的重要手段之一。

信息社会经济的迅猛发展离不开统计。在整个政府的体系结构中,统计部门起着举足轻重的作用,统计部门的数据将作为整个政府决策的一种依据。在当前信息技术迅猛发展的变革中,将日趋完善的信息技术应用到统计工作中,例如:数据挖掘技术,可以使统计工作在信息社会的发展进程中,发挥出更强大的作用,为政府决策提供更为有利的依据。

1 数据挖掘与统计学

数据挖掘是一个年轻的领域。从技术上讲,数据挖掘集人工智能、统计学、数据库管理、数据仓库、可视化、并行计算、决策支持为一体,利用数据库、数据仓库技术存储和管理数据,利用统计学方法和人工智能分析数据[1]。对数据挖掘技术在统计工作中应用的研究,可以使统计学适应大数据时代数据量的变化,挖掘出更多更有意义的数据信息。

1.1 数据挖掘是智能化统计

由于计算机技术的迅猛发展,数据存储能力的无线增加及大数据的推广应用,统计学方法也得到了迅速发展和完善。与此同时,各行各业都面临“数据爆炸”与“知识匮乏”并存的严峻形势,数据挖掘技术使得统计学与计算机技术相结合,从而从数据海洋中获取更多的信息。数据挖掘与统计学都是研究处理数据的艺术,具有相通性。统计学通过建模等从数据的特征出发去研究和发现其中有用的信息,而数据挖掘也是挖掘数据的特性,以期挖掘出更多更有意义的数据,因此,统计工作中应用数据挖掘是十分有必要的,数据挖掘可以说是统计工作借助于信息技术的发展延伸[2]。

1.2 数据挖掘的新特征推动统计学进一步发展

在数据的基础上建立模型并对模型分析是统计学家的主要工作,但是,对模型的阐述和分析并不深入,建立模型之后再进行数据分析是极为重要的。而数据挖掘的出现,可以对数据集采用不同的数据挖掘技术,可以是决策树或者神经网络或者聚类分析,从而处理数据集达到更好地预测效果。数据挖掘处理数据有以下特征:数据量大且维数高、数据结构复杂化、数据类型多样化等,数据挖掘的各种特征推动统计工作结合计算机技术进一步发展。

2 统计工作中应用数据挖掘技术的适应性分析

(1)综合应用型强。数据挖掘技术是一种能满足统计数据者特性数据需要的、综合应用型强的技术手段,不断促进统计工作向应用深度和范围广度上扩展。

(2)实际有效性高。数据挖掘具有稳定的工作性能,是一种目的明确的数据深加工技术,不仅能对统计工作的数据进行分析整理,更能通过聚类分析、神经网络等技术手段挖掘更深层次更有用的信息,在实际的统计工作应用中展现出的实际有效性很高。

(3)技术适用性高。统计工作需要强大的数据库,这为数据挖掘技术应用在统计工作中提供了平台,数据挖掘技术在此整合,保证统计工作信息的有效性、精确性,可以获得更深层次的信息资源。

3 数据挖掘技术在统计工作中的应用前景

数据挖掘的功能主要有自动预测趋势和行为、关联分析、粗糙集分析、聚类分析、概念描述、变化和偏差检测(孤立点检测)、回归分析等[3]。所以,非常有必要将日趋完善的数据挖掘技术应用到统计工作中,更深层次更合理地处理统计数据信息。数据挖掘技术在统计工作中的应用主要有以下几个方面。

3.1 开发数据挖掘系统

统计部门使用的数据格式多种多样,各个数据挖掘系统不可能对各式各样的数据库都具有通用性。同时,统计工作涉及到社会的方方面面,指标多、数据量大,没有一种完美的数据挖掘系统可以适用各种统计工作的需求,因此,要根据统计工作的实际需要开发出适合的数据挖掘系统,以适应其工作需求。可以开发多维数据挖掘系统、关系数据挖掘系统、空间数据库挖掘等。例如:基于数据仓库的数据挖掘系统,其算法能够解决在数据挖掘中对数据进行预处理耗时的缺点[4]。通过建立数据仓库能够避免每次对数据进行抽取、清洗、转换和装载的过程,按主题组织存放数据库,为数据挖掘技术选择恰当的数据源提供了便利。

3.2 提升数据挖掘质量

统计工作中,数据的质量尤为重要。政府进行科学决策和现代化管理需要准确的统计数据作为依据。在获取数据来源的质量问题上,国家统计部门极为重视,因此,统计部门的数据集的质量问题就可以很好地保证,这就需要在数据挖掘技术上减少问题,提升数据挖掘效果,从而为决策者提供更为可靠的依据。数据挖掘技术的不断改进可以提升挖掘信息的有效性和适用性。通过数据挖掘技术在统计工作中的应用挖掘出来高质量的信息,同时又能运用于实际的统计领域。例如:交互式数据挖掘能够准许用户对数据进行精确挖掘,数据焦点具备动态改变的特点,从多个角度多个抽象的层次灵活的收集数据、挖掘数据[5]。

3.3 简化数据挖掘结果

政府统计机构是使用数据的关键部门,这也暗示着政府统计工作的新的发展方向,结合数据挖掘技术挖掘出更适合决策帮助的数据信息。数据挖掘出来的结果最终使用者并非是数据挖掘的专家,而是各统计部门的相关人员,因此数据挖掘结果要简化易懂。

3.4 数据挖掘的保密性和安全性

在数据挖掘的引用中,世界上许多国家的官方统计机构已有研究计划。比如:由欧洲国家的政府机构设计的SODAS,KESO和SPIN,这些计划研究提供特定的软件,开发出具体的数据挖掘工具应用在官方统计中[6]。为充分发挥数据挖掘在政府统计工作中的潜在效益,我国政府统计部门也在研究数据挖掘技术的引入与结合。由于政府统计工作的特殊性,为避免数据泄露,要加强数据挖掘技术应用过程和结果的安全性和保密性。

4 结语

在国家的经济发展中,统计工作至关重要,随着数据挖掘技术在政府统计工作中应用的不断深入,对数据的统计分析也有更高的标准和更高的質量要求。对此,在统计工作中,要提升数据挖掘技术的应用效果,以获得更高的统计质量结果,进而为统计部门或者政府部门决策提供更为有力的决策依据。在统计工作中充分利用数据挖掘技术,将带来巨大的经济效益和社会效益。

参考文献

[1] 徐雪琪.基于统计视角的数据挖掘研究[D].浙江工商大学,2007.

[2] Pang-Ning Tan,Michale Steinbach,Vipin Kumar. Introduction to Data Mining[M].人民邮电出版社,2006.

[3] 董静.试析数据挖掘技术在经济统计中的应用[J].商,2015(31):227-228.

[4] 王恂.基于数据挖掘技术的统计工作创新研究[J].无线互联科技,2015(4):142-143.

[5] 岳悦.浅谈数据挖掘技术在经济统计中的应用[J].经营管理者,2015(30):198.

[6] 行智国.数据挖局及其在官方统计中的应用前景[J].统计科学与实践,2003(2):10-12.

猜你喜欢
数据挖掘技术统计工作应用
基于Web的数据挖掘技术与相关研究
加强基层统计工作 夯实统计工作基础
如何发挥新时期统计工作的作用之我见
探讨强化和完善水利统计工作的相关思考
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
会计与统计的比较研究