基于数据挖掘的高校云计算管理系统中特定数据查询技术

2018-01-22 00:57钟若武王惠平
现代电子技术 2018年2期
关键词:数据管理数据挖掘

钟若武+王惠平

摘 要: 为了提高对高校云计算管理系统的数据管理和信息调度能力,提出一种数据挖掘的高校云计算管理系统中特定数据查询技术。分析高校云计算管理系统中的数据结构和分布状态模型,采用数据流的互信息特征提取方法进行特定数据的关联积分挖掘,采用定量递归分析方法进行数据降维,降低数据挖掘的计算开销,实现特征数据的准确查询。仿真结果表明,采用该方法进行高校云计算管理系统中特定数据查询的查准率较高,数据挖掘的抗干扰性较强。

关键词: 数据挖掘; 关联积分挖掘; 云计算管理; 查询技术; 数据管理; 信息调度

中图分类号: TN911?34 文献标识码: A 文章编号: 1004?373X(2018)02?0130?03

Abstract: To improve the data management and information scheduling capability of the cloud computing management system in university, a data mining based specific data query technology for the cloud computing management system in university is proposed. Data structure and distribution status model of the cloud computing management system in university are analyzed. The data flow′s mutual information feature extraction method is adopted to perform correlation integral mining of specific data. The quantification recurrence analysis method is adopted for data dimension reduction to reduce computation cost of data mining and achieve accurate query of feature data. The simulation results show that the method has high query precision ratio for specific data query of cloud computing management system in university and strong anti?interference capability of data mining.

Keywords: data mining; correlation integral mining; cloud computing management; query technology; data management;information scheduling

0 引 言

隨着Web技术和云计算技术的不断发展,各大高校逐渐构建和完善高校信息管理系统,实现高校资源信息的智能管理[1]。在对高校信息管理中,需要对高校云计算管理系统中的特征数据进行准确检索和信息查询[2]。通过Web查询接口跨平台访问这些高校云计算管理系统中的特定数据,获得教师和学生等用户需要的高校管理信息,准确有效访问是数据库和云计算管理系统[3],提高数据信息的挖掘和检索效率,实现高校资源信息的智能化管理。本文提出数据挖掘的高校云计算管理系统中特定数据查询技术,提高数据挖掘和查询的效率。最后进行仿真测试,展示了本文方法在优化特征数据查询准确性和效率方面的优越性。

1 数据分布式结构分析

1.1 高校云计算管理系统的数据分布模型

云计算管理系统的数据分布结构模型主要分为基于位置结构的分布模型、层关联分布模型、链路层分布模型、隐含层分布模型和相干匹配的分布结构模型[4]。根据高校云计算管理系统数据分布结构模型,进行资源信息匹配和特征数据的信息查询链路分析[5],采用四元组描述云计算系统的特征数据结构组合模型[6],得到特征数据查询最佳路径为:

式中:表示管理系统中特定数据的元组数;表示管理系统中特定数据集中满足查询属性组合的元组数。在搜索空间中建立特点数据的特征匹配模型,假设待查询数据序列的长度为,数据流之间的关联积分为:

式中,数据挖掘点个数为,两组数据信息流在整个管理系统空间距离为:

在数据结构和分布模型分析基础上,根据数据分布的密度与终端位置进行定位挖掘和自适应特征匹配。

1.2 特定数据的特征提取

根据上述数据结构分析,采用数据流的互信息特征提取方法进行特征数据的关联挖掘,得到互信息特征提取的判定函数为:

式中:为特定数据实参数;分别为文本信息实体分布参数。

高校云计算管理系统中,根据采样样本数据的属性值和用户检索的需求,结合语义特征提取方法进行文本信息匹配[7],根据特定数据的查询条件,构建多元假设模型,得到数据查询的二元统计函数为:

结合自相关特征匹配方法,通过数据挖掘,形成一个初始的查询结果,对应的查询数据信息流的特征向量为

2 数据查询关键技术实现

2.1 数据挖掘技术

在进行高校云计算管理系统的数据分布模型设计和数据结构分析的基础上,本文提出基于数据挖掘的高校云计算管理系统中特定数据查询技术。采用最小均方误差估计方法进行数值属性权重评估[8],得到估计误差为:

式中:表示管理系统中数据重复因素;表示数据挖掘的采样时间间隔;表示信息筛选的控制变量,通过关联积分挖掘方法[9],得到数据挖掘结果为:endprint

式中,两次输出结构分布在不同的查询接口单元,时刻和时刻之间的输出数据的查询周期为,采用多元特征重组方法进行数据的级联挖掘,采用时间衰减函数控制数据挖掘的连续性,以此提高数据查询的准确度。

2.2 数据降维

为了降低数据挖掘和数据查询的计算开销,还需要进行数据降维处理,采用数据挖掘算法得到高校云计算管理系统中特定数据查询数据的信息流R1为:

式中,μw为数据特征空间维数。采用定量递归分析方法进行数据降维,得到数据降维处理后特定数据挖掘的输出结构模型为R2,可表示为:

式中,为高校云计算管理系统中特定数据差异查询属性值,采用包含匹配(Subsume)和相干匹配(Intersection)两种方式[10]。

通过特征降维处理,最终得到特定数据查询输出为:

3 仿真分析

仿真试验中,构建一组包含1 200组查询数据属性分布集数据结构模型。在云计算管理系统中进行特征数据查询设计,采用Matlab仿真软件进行算法设计。分析数据查询的准确性和抗干扰性等性能。特征数据查询节点个数为42个,数据采集容量为12 Gbit,数据的初始采样频率为120 kHz,云计算管理系统中存储了100 TB的高校资源信息,每个分割间隔为1 MB。根据上述仿真环境和参量设定,进行数据挖掘查询仿真分析,原始数据的采样时间为0~50 ms,采用本文方法和传统方法,测试特征数据查询的查准率和的时间开销对比,得到对比结果如图1、图2所示。

分析图1结果得知,采用本文方法进行高校云计算管理系统中特定数据查询,由于采用了互信息特征提取方法挖掘了特定数据的关联积分,提高了数据的查准率。

分析图2得出,随着待挖掘数据规模的增大,计算时间开销增大,本文方法的时间开销总体低于传统方法,提高了对云计算管理系统的特定数据访问和挖掘的效率。

4 结 语

本文研究了高校云计算管理系统特定数据查询问题,提出数据挖掘的高校云计算管理系统中特定数据查询技术,采用数据流的互信息特征提取方法进行特定数据的关联积分挖掘。为了降低计算开销,还进行了数据降维处理,实现特征数据的准确查询。研究得出结论,采用本文方法进行数据查询的查准率较高,计算时间开销较短,提高了高校云计算管理系统的特定数据查询挖掘的准确性和效率,具有一定的应用价值。

参考文献

[1] SUN L, GUO C H. Incremental affinity propagation clustering based on message passing [J]. IEEE transactions on knowledge and data engineering, 2014, 26(11): 2731?2744.

[2] 周唯,邹东升,牛宝君.基于移动云计算的高校教学资源整合系统[J].计算机应用,2016,36(z1):33?36.

ZHOU W, ZOU D S, NIU B J. Teaching resources integration system for colleges and universities based on mobile cloud computing [J]. Journal of computer application, 2016, 36(z1): 33?36.

[3] 陈翔.面向云计算模型的高校科研管理信息系统实施策略研究[J].邵阳学院学报(自然科学版),2015,12(2):18?21.

CHEN X. Research on the implementation of university research management information system based on cloud computing model [J]. Journal of Shaoyang University (Natural science edition), 2015, 12(2): 18?21.

[4] MERNIK M, LIU S H, KARABOGA M D, et al. On clarifying misconceptions when comparing variants of the artificial bee colony algorithm by offering a new implementation [J]. Information sciences, 2015, 291(10): 115?127.

[5] 邢行,尚颖,赵瑞莲,等.面向多目标测试用例优先排序的蚁群算法信息素更新策略[J].计算机应用,2016,36(9):2497?2502.

XING X, SHANG Y, ZHAO R L, et al. Pheromone updating strategy of ant colony algorithm for multi?objective test case prioritization [J]. Journal of computer application, 2016, 36(9): 2497?2502.

[6] HAN J, KAMBER M. Data mining concepts and techniques [M]. 3rd ed. San Francisco: Morgan Kaufmann Publishers, 2012.

[7] KESHAVAMURTHY B N, KHAN A M, TOSHNIWAL D. Privacy preserving association rule mining over distributed databases using genetic algorithm [J]. Neural computing & applications, 2013, 22(1): 351?364.

[8] MORADI M, KEYVANPOUR M R. An analytical review of XML association rules mining [J]. Artificial intelligence review, 2015, 43(2): 277?300.

[9] 张啸剑,孟小峰.面向数据发布和分析的差分隐私保护[J].计算机学报,2014,37(4):927?949.

ZHANG X J, MENG X F. Differential privacy in data publication and analysis [J]. Chinese journal of computers, 2014, 37(4): 927?949.

[10] 张磊,王鹏,黄焱,等.基于相空间的云计算仿真系统研究与设计[J].计算机科学,2013,40(2):84?86.

ZHANG L, WANG P, HUANG Y, et al. Research and design of cloud computing simulation system based on phase space [J]. Computer science, 2013, 40(2): 84?86.endprint

猜你喜欢
数据管理数据挖掘
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
探讨人工智能与数据挖掘发展趋势
CTCS-2级报文数据管理需求分析和实现
列控数据管理平台的开发
基于并行计算的大数据挖掘在电网中的应用
数据挖掘技术在中医诊疗数据分析中的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于云计算的数据管理技术研究