云计算平台下数据挖掘算法研究

2017-02-26 18:47查道贵许彩芳
信阳农林学院学报 2017年1期
关键词:数据挖掘资源算法

查道贵,许彩芳,陈 伟

(宿州职业技术学院 计算机信息系, 安徽 宿州 234101)

云计算平台下数据挖掘算法研究

查道贵,许彩芳,陈 伟

(宿州职业技术学院 计算机信息系, 安徽 宿州 234101)

伴随着网络信息化建设的万象更新,云计算平台下数据挖掘算法日益重要。为求解云计算平台下海量数据的科学分析与整合处理,本文就云计算平台下数据挖掘算法的现实应用、云计算平台下数据挖掘算法的挖掘建构流程及服务应用体系,做出具体探讨,为数据挖掘的集成开发与商业应用提供参考。

数据挖掘;服务;云计算

目前,国内外云计算技术尚处起步阶段,还仅限于开发研究与初步应用的“雏形期”,尚未形成规范性的统一定义与整体标准。综合分析各类云计算,突显四大共性特色:云环境存储规模性;云环境超强性;云环境资源动态性;云环境结构伸展性。而差异性的特色,则在于依靠不同领域庞大资源与虚拟技术的“并驾齐驱”,分别完成按需供应的特色服务。大势所趋之下,云计算平台数据将何以挖掘,成为亟待探讨的话题。

1 独具市场活力的数据挖掘算法的现实应用思考

1.1 商业发展需求的迫切性

伴随业务量的突飞猛进与业务范围的极限扩张,带来了商业数据的海量“囤积”,极具规模的数据库令企业应接不暇。一边是市场竞争的“独力难支”,一边是数据传统挖掘方式的“积重难返”,“一头雾水”的经营者在创建企业再发展中“望洋兴叹”。传统计算能力已经难以满足海量数据的挖掘需求,已经造成了再发展危机。同时,网络大环境下,出于海量数据跨地域性再生业务的增势与发展前景考虑,寻求高性能新式数据挖掘算法,已成当务之急。因此,构建一个融数据存储、数据分析于一体,全面实现分布式数据处理与数据挖掘的云平台模式,已成企业众望所归。

1.2 数据挖掘算法的前沿性

云计算平台下的共享资源存储形式以分布式的特色,其挖掘数据任务执行模式与本地单机式挖掘形式“大相径庭”,所充分体现的也是网络环境中数据挖掘的鲜明亮点。云计算服务器群体的超规模化令人乍舌,同时拥有的超强计算能力更出人意料。尤其云存储作为时代的“宠儿”,所展现存储能力强大性的“无与伦比”,综合分析能力超强性的“难以比拟”,数据管理无限性的“心思缜密”,置身再“海量”的数据也自当“处变不惊”、“游刃有余”。目前已有的数据挖掘算法多以整体系统作为中心,尤其注重算法与系统的完整统一。云计算平台最为突出的特点,在于面向服务视野作数据挖掘,将规范化与科学化兼顾一身,提供出前沿性的独到解决方法。纵观云平台始终,无论平台运行,还是海量存储,或者软件开发应用,均有独到“修为”,联手成就一种共享空间下的网络互动资源,“包罗万象”于无形,在统一接口之下,把资源整体封装为一个整体,并以服务互动的模式给用户与开发者提供支持。同时,云计算按需出售的软件商业计算模式,也将挖掘数据程序的服务性能完美给予体现,这对于企业不仅是挖掘数据成本的有效降低,更是为挖掘数据商业化应用搭建前沿性平台。

1.3 数据挖掘算法的科学性

其一,基于云计算平台的挖掘数据的科学算法探究,即通过科学改进手段或系统移植策略,开展云计算平台下的一种网络算法,进一步拓展其算法的科学性能;其二,基于云计算平台挖掘数据的系统架构探究,即通过整体结构的系统分析与构建设计,综合挖掘数据平台;其三,基于云计算挖掘数据的应用探讨,即实现商业化应用的云计算平台数据挖掘方案。有的将云计算技术应用于数据挖掘与机器学习两个不同领域,特色在于K邻近与约束玻尔兹曼式机算法的结合应用,并基于云计算平台创设出客户兴趣的预测模型,使模型精度得以有效提升。有的则独辟蹊径,从资源与服务不同角度创设云架构,并设计容高性能与广域性于一身,即分布式海量数据定向管理与综合分析、多向抽取与系统分配为一体的云平台挖掘数据架构。

2 云计算平台下数据挖掘算法的建构思路探讨

2.1 云计算平台下数据挖掘算法的建构思路

依据网络科学,“云计算平台下数据挖掘算法”的主要表现形式是:云计算平台通过“Iaas”(基础设施)、“Paas”( 服务平台)与“Saas”( 服务软件)三种模式服务,将数据化存储与计算设备、平台开发与服务软件等平台资源,以不同的网络技术支持突出特色服务的亮点模式,形成一套客户需求“供给制”的计算综合服务。云计算平台下的数据挖掘,作为网络计算资源的一种独特应用,归根结底是一道服务的“计算题”。客户端递达云端的挖掘数据任务,本身就视作一种“云服务”; 处理器与存储空间就是服务的广域资源,数据挖掘的执行操作也属于运算的综合服务范畴;具体到数据信息的“收集整合”、数据仓储“综合拓展”与数据挖掘算法“统筹兼顾”等,各环节均可视为数据挖掘“服务组合”中的不同取向性服务资源。

所谓技术性挖掘数据服务,是数据功能属性与行为挖掘的技术集合体,无论从数据的定向选择到数据取向的前期运作,还是数据整合到数据挖掘与系统分析,或是综合评价与最后结果展示等,贯穿始终的均为服务整合与服务搭配特色功能,最终所概括而出的是复合型的服务应用。云计算实现了计算机端口设备与网络存储设备“合二为一”,创设了服务器集群服务与网路集成应用平台“齐头并进”,打造了应用软件与网络资源“共享天下”。基于这样的思路,通过虚拟化与集成技术的量身定做,接口组件与软硬件组合的“打包封装”,最终结成形态各异的服务链接,以响应开发平台、基础设施和实现应用等客户不同层面上的服务要求,分别为“Iaas”(基础设施服务)、“Paas”(平台服务)与“Saas”(软件服务)。三种层次实现三重服务,进而形成一整套的服务支持组合。基于这样的网络科学,云计算平台下进行的数据挖掘足以给客户组合式、系统化的数据储备与开发服务、数据挖掘与应用支持,在综合性的运筹帷幄中,全面落实数据挖掘“技术型”与“服务型”方案的具体整合。将服务需求与行为支持贯穿于数据挖掘进程始终,贴紧云计算组合整体结构与“SOA”架构(面向服务体系结构),创设演绎出云计算模式数据挖掘的服务构架。

所谓基础性设施服务,指向性在于数据中心的基础性支持,主要表现为计算资源成就了数据挖掘的服务行为,并塑造出远程资源访问能力的前沿性。远程数据资源的支持服务属数据库托管式行为,需求驱动的远程数据库与数据仓储技术,其先进性足以使客户如同使用本地数据信息般“一览无遗”,方便快捷。就业务流程而言,数据挖掘行为简洁明了,而服务方式却具有丰富的广域性,形成包罗万象的多系统涉猎。其特点在于,将相应的数据信息对接绑定于关键模块,以关键模式分工挖掘流程,以此挖掘模式的具体构建,系统完成远程资源的整合与开发。所谓应用服务,可具体为软件的开发与运用,是以程序应用的整体性具体履行数据挖掘不同的属性行为,最终依托平台完成客户的交付使用。测试服务则是以远程托管为依托完成测试工具的创设,实现云平台交付数据挖掘或本地数据挖掘的系统测试与评估;平台服务则是注重于应用数据系统挖掘的远程开发整合,主要形式在于应用程序与链接端口开发,并兼容数据库的配套拓展,同时兼容信息存储与数据集成、系统测试与体系部署等综合功能,让客户基于此创建企业级的数据挖掘应用。

所谓集成服务,在于语义仲裁与抽象接口、流控制与整合设计的集成技术支持,最终形成服务形式,达成对客户的交付使用。众所周知,云计算最大薄弱点在于安全性的“举步维艰”,云安全也成为互联网技术的长久话题,也是众多操作系统鼎力不懈的探索。本研究以加密服务为手段,以身份管理的监控为抓手,打造规范性与先进性的等级式安全服务职能,为挖掘数据全面性地构建云计算的安全环境。云计算模式下的数据挖掘,通过服务架构的综合打造,可使客户便捷灵活地使用服务资源。同时,贴近市场需求的“量身定做”,也使动态服务更加成为可能。

2.2 云计算模式下建模流程的主要做法

要完成数据挖掘的系统化服务, 关键在于上述对服务架概括性的全面分析, 在于每个组件模型中挖掘服务每一处个性数据的第一手建立。通过服务支持的考究与识别与信息数据的互动关联,以此为据打造具有完整性的一处服务构件,建模流程的主要做法有三。其一,如何定义于服务。问题的关键在于对域内信息数据的理解与归类,在于数据收集与挖掘的服务属性思考与分析,从而定义出该服务潜在的核心性功能、信息数据的取向支撑及服务集成的组合产出。具体而论,对服务做出属性定义,从中可以窥视数据挖掘行为与服务组合的整体关联性,进而形成数据挖掘候选服务目录中的理性思考。其二,如何绑定数据创设服务。整体数据化挖掘服务由其自身功能属性与趋向性数据体系共同构建而成,由此可见,服务定义的严密性不容忽视,其关联属性数据的结合与候选服务的取舍也极具规范性。因此,基于严谨的科学态度,数据的组合绑定与服务集成创设也应合理规范。其三,如何构建服务属性组件。结合规范的处理整合,服务探讨中的属性策略与服务绑定中的组合信息,最终达成服务的定义功能属性,并在封装打包模式中成就具有独立性的每一处服务组件,以此,定义并调用起统一的服务接口,形成独立环节服务组件的完整性。

3 云计算平台下数据挖掘算法的应用服务体系研究

3.1 模型体系结构的特色

3.1.1 基础层的“终端性” 基础设施层的特点,在于提供挖掘数据服务资源型的计算与资源存储的基础性服务。其主要形式,在于依据终端接口的链接,将千姿百态的物理资源尽收网络“囊中”,以数据共享全面实现网络信息资源的平台互联,并逐步形成虚拟层的直观展示,创设虚拟化进程的终极接口。

3.1.2 虚拟层的“逻辑性” 在虚拟工具的导向性对接中,虚拟层做出“逻辑性”判断,将云计算平台下分布的各种资源“物以类聚”,进行透明性与逻辑性服务属性资源的封装打造。并通过对逻辑资源的规范管理,实现资源合理的调度与分配, 并将封装的资源传递于平台层,以供其开发与应用。

3.1.3 平台层的“核心性” 平台层作为挖掘数据服务的核心服务层,其“核心性”在于服务的整体实施与综合治理。包括服务取向性建模以及目录管理的支持组合,兼顾任务探讨、调度计算及数据管理的完整性。

3.1.4 应用层的“广域性” 应用层由终端层与接口层所共同构建,有其鲜明的“广域性”。由接口层为其链接客户认证、客户管理、需求表达与需求处理,由终端层为其搭建不同地域的访问接入,并通过网页、移动终端等终极端口,客户可方便完成访问链接,使用系统的云数据挖掘式服务。

3.2 模型体系结构的构建要求

分析期要“定义科学”。要根据具体需求给予科学的甄别与发现,适时做出合理性的定义与判定,启迪服务的生命发展新周期。

设计期要“接口规范”。要结合服务行为的具体属性定义与探讨,规范形成服务属性说明,完善服务设计的接口严谨与契约规范,以确保服务定义与非功能特性的传承进度。

开发期要“集成功能”。要全面展现功能服务支持的独到属性,在服务定义的切实取舍下,进一步做好低耦合结合高内聚的集成功能文章,完善功能属性的互动与沟通。

维护期要“有的放矢”。要在支持服务设计的前提条件下,有的放矢,及时对开发缺陷做出具有时效性的修复,并根据服务领域的具体需求,适时更新服务支持版本,为长久的循环发展做出积极努力。

[1] 王 鹏.走进云计算[M].北京:人民邮电出版社,2009.

[2] 徐 昕.增强学习与近似动态规划[M].北京:科学出版社,2010.

[3] 范 波,潘 泉,等.多智能体学习中基于知识的强化函数设计方法[J].计算机工程与应用,2005(3)77-79.

(编辑:严佩峰)

Data Mining Algorithm on Cloud Computing Platform

ZHA Dao-gui, XU Cai-fang, CHEN Wei
(Computer Information Department of Suzhou Vocational and Technical College, Suzhou 234101, China)

Along with the various innovation of network informatization construction, data mining algorithm on cloud computing platform has become increasingly significant. To solve the scientific analysis and integrated processing issues on cloud computing platform, the essay combines the reality application, mining construction process and service application system of the data mining algorithm on cloud computing platform and conducts concrete discussion and research at these three levels, aiming to provide reference for the integrated development and commercial application of data mining.

data mining;service;cloud computing

2016-11-23

安徽省高校自然科学研究重点项目(KJ2016A778).

查道贵(1975—),男,安徽安庆人,硕士,讲师,研究方向:计算机应用.

TP311.13

A

2095-8978(2017)01-0113-03

猜你喜欢
数据挖掘资源算法
基础教育资源展示
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
一样的资源,不一样的收获
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
资源回收
资源再生 欢迎订阅
一种改进的整周模糊度去相关算法