数据挖掘技术在软件工程中的应用探究

2020-08-04 10:02梁雯
关键词:数据挖掘技术软件工程应用

梁雯

摘要:随着科学技术的高速发展,人们的生活行为、个人喜好、出行轨迹甚至个人社交都能通过一连串复杂的数据来显示。强大的数据网络对人们的工作生活及科技发展产生了重要影响。因此,如何在庞大的数据网络中找到有价值的、有需要的数据,成为了数据信息技术的一个研究方向。数据挖掘技术在一定程度上解决了这个问题。文章结合数据挖掘的内涵,分析数据挖掘技术在软件工程中的作用,提出一些应用方法,旨在对我国软件工程和科技发展提供参考。

关键词:软件工程;数据挖掘技术;应用

中图分类号:TP311  文献标识码:A

1 引言

数据挖掘是大数据分析领域中的一个新的数据处理理念,它的核心思想是通过对数量巨大、但价值密度低的数据进行分析处理,从而提取出一些对所研究的问题有价值的信息。随着软件工程的发展,在软件开发和项目管理过程中也逐渐出现了海量数据分析的难题,例如源代码管理、版本管理、漏洞分析、系统操作记录。软件长期运行所积累下来的数据,由于数据量过大,传统的数据处理技术显然是不可能完成的。为此,研究数据挖掘技术在软件工程中的应用具有重要意义。

2 数据挖掘技术的概述

数据挖掘是在大量的数据中探测有意义的行为和规律,它不仅可以应用于研究领域,使研究人员快速获取大量目标数据,还能够应用于商业中等多个领域。该技术可以了解数据中潜在的规律,还能够用历史数据对未来进行预测。它能够检测海量数据中的异常数据,发现数据中显著不同于其他数据的对象。数据挖掘系统也在不断的发展,初代系统是作为一个独立的应用,可以支持一个算法,也可支持多个算法,而现在的系统能够和各种移动数据相连,并且大多都存在计算模型,可以应用于多种移动设备。在进行数据挖掘的过程中,首先要对数据进行预处理,能够对不一致或不完整的数据进行清除,还能够进行数据的抽样,能够保证数据的正确性以及统一性。随后需进行数据的挖掘,挖掘过程中有多种算法可对数据进行分类与预测,分类过程中可以构建模型对现有的数据和新数据进行分类,建立函数值模型能够对数据进行预测,此外还有聚类、关联等算法。最后需要根据挖掘过程中所选择的算法和最终产生的结果对整个过程进行评价,还要将结果传递给客户,需要将信息模式进行转换,使用户可以理解。

3 数据挖掘技术的应用流程

数据挖掘技术在软件工程中的应用主要包括数据预处理、数据挖掘、模型表现等三个不同的阶段。在数据预处理阶段,主要任务与目标是,对获取的原始数据进行处理,厘清目标对象,实现有效数据的分离,并且在数据预处理的过程中,对软件工程中涉及到的原始数据进行了清理,将冗余信息进行清除,同时对部分缺失数据进行补充,形成完整的数据链条,从而为后续软件开发、软件管理以及软件评测工作的开展提供了参考。在数据挖掘的过程中,为保证挖掘效果,需要明确挖掘人物,认真做好数据的分类、归纳、评估以及总结工作,在此基础上,对挖掘方法进行针对性选择,选择过程中,要结合数据自身的特点以及软件工程相关工作的具体要求,对数据挖掘方法做出必要的调整,确保挖掘的有效性。为实现挖掘结果的完整表达,可以使用模型评价或者知识表示的方式,将数据挖掘的结果以更加完整、系统的方式呈现出来,使得相关工作人员能够在相关数据挖掘结果的指导下,有针对性地开展软件开发、管理以及测评工作,大大增强了软件工程的时效性,为后续相关工作的开展奠定了坚实基础。

4 数据挖掘技术在软件工程中的应用

4.1 软件管理中的应用

软件管理中的应用可以分为两个方面即可进行开源软件的管理,又可进行软件项目的管理。开源软件较为特殊,因此它的使用不需收费。由于开源软件较多,并且所有人都可以随意使用,因此管理过程有较大難度,开源软件的质量也难以保证。利用数据挖掘技术,能够提高开源软件的质量。利用该技术进行项目管理时,利用数据挖掘技术能够整理组织关系,有利于信息的交互。软件开发过程中需要不断进行版本的更新和漏洞的修复,开发者可以利用数据挖掘技术查看历史版本和以往出现的漏洞,避免这些问题在开发过程中重复出现,有利于软件的开发和后期的维修与管理。

4.2 项目管理

在具体的数据挖掘技术应用中,软件工程企业可以针对组织关系和版本控制数据进行数据挖掘。组织关系数据虽然相对繁琐,但有利于软件工程企业进行企业和项目的管理,梳理组织系统和组织管理,保障资源调配和应用的系统性和有效性。而版本控制数据是指数据挖掘技术中对数据进行控制和调整变化的数据部分。通过对这方面数据的应用,能更好的控制企业信息,出现混乱的流程和问题时能及时调整,提高软件运行的稳定性。根据这一特点,企业还能将数据挖掘应用到对问题进行提前预警和及时解决的过程中去,全面提高项目管理质量。

4.3 软件漏洞扫描

漏洞检测是软件工程的重要内容,是发现安全隐患、提高软件质量、保障系统安全的有效措施。在传统的漏洞检测技术中,由于需要扫描的数据量过大,如果逐条依次分析,将导致长时间的等待,可操作性不强。在漏洞扫描中引入数据挖掘技术,可以有效提高扫描效率。典型的基于数据挖掘的软件漏洞扫描应用步骤如下:第一,创建测试项目。根据用户的具体需求制定软件测试方案,明确需要扫描哪些类型的漏洞,采用什么方案进行扫描。第二,收集漏洞信息。扫描漏洞的前提是要认识漏洞,也就是对漏洞进行定义。需要收集有关软件缺陷的大量信息,并对一些属性进行定量化处理。第三,选择理论模型。根据扫描要求,选取适当的数据挖掘模型,根据前期收集的数据资料,对模型进行充分的训练,得到有效的训练集与测试集,取得最佳扫描策略。第四,开展漏洞扫描。采用前一步得到的模型,将其应用于软件扫描测试过程,经过数据的分类和特征分析,提取漏洞信息。第五,根据扫描结果,修复漏洞,并重新扫描以确认漏洞的成功修复。

4.4 着力提升故障检测能力

软件工程涉及技术类型较为多样,软件工程中一旦出现故障,势必影响整个软件开发的进度,造成额外的成本支出。同时由于技术的复杂性,使得软件工程故障的排除难度较高。数据挖掘技术的应用,可以根据软件编写中API等规则,对运行过程中产生的各类信息进行分析,在分析过程中,如果发现错误信息,及时向工作人员发出提示,进行警报。工作人员在获取警报后,根据相关信息,对软件的故障区域进行针对性的维护、处理,从而大大增强故障检测以及应对能力,实现了软件工程体系的优化升级。

5 结束语

数据挖掘技术在现代科技发展中发挥了重要作用。不仅能保障软件工程企业的设备运行的安全性和准确性,还能促进软件产品的优化进程,帮助更好的为客户服务。因此,企业可以在实际工作中用数据挖掘技术代替传统的信息处理技术,凭借其优异的数据处理能力和数据分析能力,降低企业科技研发成本和维护成本,保障企业的发展。

参考文献:

[1] 吴金玲.数据挖掘技术在软件工程中的应用[J].产业创新研究,2019(03):115-116.

[2] 龙艳.分析数据挖掘技术在软件工程中的应用[J].科技风,2019(02):83.

[3] 梅拥军.软件工程中数据挖掘技术的应用[J].电子技术与软件工程,2019(01):141.

[4] 程志平,徐涢基.数据挖掘技术在软件工程中的应用探究[J].信息技术与信息化,2018(12):210-212.

[5] 蔡斌.数据挖掘技术在软件工程中的应用[J].电子技术与软件工程,2018(21):148.

猜你喜欢
数据挖掘技术软件工程应用
基于Web的数据挖掘技术与相关研究
依托工作室的软件工程实践教学研究
基于工程教育认证的《软件工程》课程教学质量建设研究 
关于如何创新和完善计算机软件工程管理的探讨
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
会计与统计的比较研究