数据挖掘在中国的现状和发展研究

2018-10-27 10:54刘芬
山东工业技术 2018年17期
关键词:数据挖掘中国现状

刘芬

摘 要:数据挖掘学科的出现,是对计算机领域的补充,在计算机领域的发展下发展迅速,引起了国内的重视,并在国家的大力促进下不断发展,取得了阶段性的成就,但是发展现状仍然不容乐观,本篇文章将针对数据挖掘的定义以及国内的现状进行分析,并对其发展趋势进行预测,目的在于加快我国的数据挖掘技术研究进程。

关键词:数据挖掘;中国;现状;发展

DOI:10.16640/j.cnki.37-1222/t.2018.17.110

0 引言

随着计算机的发展与数据量的增加,其对于数据的处理技术如生成、收集、储存数据等的水平要求越来越高,因此新型的数据挖掘技术的出现是必然趋势,替代了传统落后的数据处理技术。我国对于数据挖掘技术的研究已经取得瞩目的效果,但是应用程度不高,提高数据挖掘技术的实际应用成为了主要的问题,需要采取必要措施加快数据挖掘技术应用进程。

1 数据挖掘的定义

数据挖掘(DM)是一个新兴的学科,学名叫做数据库中发现知识(KDD),其出现在20世纪90年代,并在这三十年间发展迅速,它的主要工作领域为数据库系统以及数据库应用领域,其作用在于能够从应用数据中提取隐藏的关键信息与知识,应用数据的范围广泛,不管是不完整的数据,还是受干扰的数据,数据挖掘技术都能够通过对其数据的转换分析或者模块化处理进行识别与筛选,并提取和处理其中的有用信息。数据挖掘的目的在于通过对数据中信息的处理,筛选关键数据,发现被忽略的数据,从而寻找数据中的规律,为决策者提供合理科学的数据分析报告,帮助其作出最优化的决策。

数据挖掘技术学科的本质在于加深对数据的使用层次,挖掘数据的内在含义并进行抽象化的概括,改变了以往数据只能简单查询的低级层次。数据挖掘具有先知性、实用性以及科学性的特点,同时数据挖掘的发展依赖于数据库、人工智能统计学等计算机学科的快速发展,因此吸引了一大批专业人才加入到其的研发过程中,加快了其的研究发展进程。

2 数据挖掘在中国的现状分析

2.1 研究现状分析

我国开展数据挖掘技术的研究在1993年,中科院合肥分院成为首个被自然科学基金支持进行数据挖掘技术研究,从此以后,我国掀开了研究数据挖掘研究的序幕,主要研究机构与人员主要是相关专业的大学教授以及一些数据处理研究机构。近年来,我国对数据挖掘的研究工作高度重视,通过中国自然科学基金等对其进行资金支持,同时,政府创立“九五”计划以及 “863” 计划对其提供政策支持。

数据挖掘的研究引起了我国相关专业的人才的广泛关注,并在全国范围内掀起了研究数据挖掘知识技术的理论与实际应用的热潮,其中包括高等学府与科研机构。例如:对于数据挖掘技術的算法计算与改造研究是复旦大学与华中理工大学等高校的研究方向,非结构化数据知识的网页数据挖掘技术是南京大学的主要研究方向,而科研机构如北京系统工程研究院来说,其主要研究方向是数据挖掘技术在模糊信息中的实际应用。

2.2 应用现状分析

在我国,能够真正应用数据挖掘技术并取得成就的公司包括是广州华工明天科技有限公司以及菲奈特-融通企业,其中广州华工明天科技有限公司主要进行多功能数据挖掘设备的研发,而菲奈特-融通企业依赖于数据挖掘软件的发展进行其商业智能套件的研发。

2.3 研究成果分析

近年来,由于国家的大力扶植与资金支持,我国数据挖掘技术研究取得了重要性的成果,在亚太数据挖掘的国际会议中,由南京大学周志华带队的数据挖掘技术研究小组表现突出,同时参与数据挖掘编程大赛并夺得桂冠;同样在了亚太数据挖掘国际会议上,中国香港大学的电子商业科技研究院的黄哲学教授的论文获得亚太数据挖掘国际会议论文大奖。

2.4 国内外对比

国内外的数据挖掘技术研究的进程具有很大的差距,不仅表现在相关理论的研究上,更在于对数据挖掘技术的实际应用的方面。与国外的数据挖掘技术研究进程相比,我国的研究起步晚,仍然处于发展的初级阶段,并且还没有成熟的理论与技术应用成果,目前的主要研究方向是对于数据的初级处理如模糊化处理,技术尚不成熟。

国外关于数据挖掘技术的软件研发发展已经取得瞩目的成就,而国内的软件研发尚不成熟,研究的重心在于高等学府的人才,同时都是属于政府资助项目,可能导致其成果要求较低,从而阻塞了研发的步伐。

3 数据挖掘在我国的未来发展

3.1 研究方向展望

近年来,随着计算机科学领域的快速发展,数据挖掘技术作为一种新兴的学科,其研究热度正在逐渐升温,研究的水平也在逐步提高,同时由于国家政府的政策支持与资金支持,越来越多的数据专业研究者被吸引加入其中。在数据挖掘技术未来的研究过程中,其主要方向应包括以下几点:

(1)参照于SQL语言的标准化的研究成果,对数据挖掘技术进行形式化的描述,即发现数据语言。(2)为实现关于数据额挖掘技术人机交互工作的顺利开展,应满足用户对知识发现过程的可视化进程。(3)研究在计算机领域的数据挖掘技术的发展,可以通过数据挖掘服务器的有效配合的方式实现。

3.2 面临的问题

(1)挖掘方法与人机交互问题。我国数据挖掘技术的发展受限制于挖掘方法,不管是知识类型的限制,还是维度上的限制,都是影响其发展的重要因素。(2)性能问题。能够有效的解决数据挖掘技术算法中的问题是解决其性能问题的关键,应对其有效性、可伸缩性等问题进行研究,保证其算法能够满足用户的性能要求。(3)数据类型多样性问题。对于算法复杂的,多维度的数据类型,现有的研究水平很难去解决此类问题,同时对于多跨度的全球化信息技术的挖掘水平仍然落后。

4 结束语

数据挖掘技术作为新兴的数据应用工具,能够有效的加强对数据的处理程度,但是由于我国研发起步晚,导致我国的发展水平落后与国外水平。近年来,国家对数据挖掘技术的政策与资金支持,掀起了研究的热潮。我国应重视数据挖掘算法研究以及其实际应用,不断地发展数据挖掘技术的研究。

参考文献:

[1]谢邦昌,李扬.数据挖掘与商业智能的现况及未来发展[J].统计与信息论坛,2015(05):94-96.

[2]李菁菁,邵培基,黄亦潇.数据挖掘在中国的现状和发展研究[J]. 管理工程学报,2016(03):10-15.

猜你喜欢
数据挖掘中国现状
数据挖掘综述
软件工程领域中的异常数据挖掘算法
职业高中语文学科学习现状及对策研究
语文课堂写字指导的现状及应对策略
混合动力电动汽车技术的现状与发展分析
我国建筑安装企业内部控制制度的构建与实施的措施
基于R的医学大数据挖掘系统研究
肯尼·格雷特,爵士的“中国”调子
一本面向中高级读者的数据挖掘好书