大数据挖掘技术在电力审计风险防范中的应用研究

2021-11-22 17:20禹湘晖广东电网公司调度中心
现代经济信息 2021年26期
关键词:结余数据挖掘审计工作

禹湘晖 广东电网公司调度中心

引言

大数据挖掘技术属于一种基于数据分析与数据挖掘的计算方式,目前在许多领域均有着广泛性应用,按照国网审计业务的综合分析,目前已经在许多领域均有应用,按照电力审计风险防范工作特征来看,其主要是将验证性的分析方式转变为挖掘性的分析方式,并将审计方式转变为风险预警,实现对审计思维、内容、目标、技术等多方面的优化改进,并基于聚类分析算法方式实现应用空间的扩展。伴随着信息化及时的持续性发展,数据形成速率以及生成量持续增多,大数据挖掘技术的应用价值也会随之提升。对此,探讨大数据挖掘技术在电力审计风险防范中的应用具备显著实践性价值。

一、大数据挖掘技术在电力审计中的应用

对于挖掘性的数据分析方式属于大数据中最为典型的一种技术形式,其主要是从大数据当中寻找到隐含的数据规律的模式,并以预测的方式将趋势与行为完成数据的分析,数据挖掘技术属于实现发掘性有价值数据的一种处理方式[1]。大数据挖掘技术的关键在于数据挖掘的算法,算法属于数据中非线性关系与因果关系的决定性因素,不同的算法可以应用于不同的场景。当前按照大数据挖掘技术的大数据审计可以在财政、金融、电信、保险等多方面提供海量数据并实现对行业生命力、效能的强化,逐渐在财政审计、工程审计、民生专项资金以及社保资金审计等方面提供支持。

(一)数据挖掘算法

大数据挖掘技术中关键的技术便是数据挖掘算法,聚类分析方式主要是将所有数据对象划分成为不同的子集,其目的是将同一个子集当中的对象保持高度相似性,对于不同的机组中对象差别相对较大,聚类算法属于无监督性学习方式,因为所涉及到的数据提供不同的类型标签数据,借助观察学习实现对非示例的学习,聚类可以实现对数据内在性质与规律的挖掘,从而实现对数据综合分析,聚类分析方式主要涉及到划分方法、层次方法以及基于密度与网格的方式。

(二)数据挖掘过程

普遍而言,数据的挖掘过程主要涉及到三个阶段,分别为数据准备与数据预处理、数据挖掘模型建设、数据的运用与评估。

在数据准备与预处理方面,主要是将审计问题转化成为数据挖掘问题,明确问题相关数据源之后将不同数据源集中到一起,并形成原始的审计数据资料,数据预处理过程中需要实现对数据的完整性处理以及噪声判断,对于不理想的原始数据实现预处理并实现对数据清理、集成以及规约等转变[2]。数据挖掘模型的构建方面,主要是按照审计任务和转换完成之后的数据类型,采用适当的数据挖掘技术,并从相应的算法库当中采用适当的算法和综合应用算法方式构建数据挖掘模型,建设模型期间属于反复进行的,借助修改模型参数的方式按照不同评估方式对比模型实现对最有效模型的判断。在模型应用和评估方面,将处理后的数据基于数据输入模型和输出分析的结果,在设置好模型参数之后通过计算机自动完成计算,模型的评估主要是对模型完成审计任务的质量进行评估,并衡量模型的适用性。

(三)大数据审计

基于全业务的数据中心建设方式,基于国家电网地方企业结合自身信息化的发展需求和已有的专业领域信息系统构建成果数据资源并构建全业务的数据中心,面向全业务范围、类型以及时间维度等实现统一性的储存与管理服务,为企业提供全量的业务数据汇总与数据分析统一服务,实现业务高度融合以及数据充分分享,基于全业务的统一性数据中心挖掘方式,可以综合分析并开展夯实基础、数据扩充介入以及资源在线纳管的处理工作,从而进一步完成数据资源的储存与应用,更好的服务于大数据分析应用。基于二级部署系统的介入以及一级部署系统数据按需介入,实现对业务数据的有效处理,结构化的数据接入表与数据总量达到TB级,采集数量涉及设备上百万台,非结构化的数据也可以实现对大量采集。对于业务系统数据可以基于系统数据仓库模型实现规范化的储存,并为后续大数据分析奠定基础。

在数字化审计平台建设方面,基于全业务数据中心的大数据资源,基于数字化审计平台的建设目标,打破传统专业系统之间的壁垒,采用全业务数据中心的海量数据资源,可以实现对数据字段的综合分析,并基于营销、财务、工程以及物资等实现对不同业务领域的审计需求并构建智能化审计模型以展示审计结果,对存在疑点信息以及资料明细的业务数据实现穿透性的查询,借助图像化的方式可以实现对在线智能审计工作成果的判断,促使审计问题与结果保持可视化。

二、大数据挖掘技术在电力审计风险防范中的应用案例

为了更好的贯彻落实生态环境保护、清洁取暖等政策精神,某电力企业投资大量资金实现对配电网的改造与煤改电等民生项目的建设,内部审计属于保障企业重大项目安全稳定有效落实的关键,可以实现全程化的民生项目资金审计工作。借助重大民生项目的资金构成,发现约有50%的资金应用于购置物资并存在大量的结余表现,资金风险相对较高[3]。对此,内部审计工作期间需要将物资的全流程风险防范作为民生项目的审计工作重点。

(一)工程物资管理风险

企业的物资管理部门采用常规物资管理全流程模式,在物资采购和配送、物资需求与采购配送等环节中应用SAP系统开展操作,线下按照采购清单根据相应比例收货,物资管理部门的全程监控在物资结算方面需要基于工程现场实际情况实现对物资结算清单的管理,同时基于管理、施工、监理以及设备运行等不同部门进行联合确定,设备运行单位需要将现场所应用的设备投入到PMS系统中,保障系统中电网拓扑结构和实际情况保持一致,从而确保电网的安全稳定性,确保工程物资结算时的准确性。在结余物资退库方面,因为不同地区供电企业的物资仓库容纳空间有限,大量结余的物资线下无法实现有效的退回,只能够存在其他的非注册仓库中[4]。按照这一风险问题,内部审计工作期间需要将工程结余物资的总量作为审计的工作重点,并借助大数据挖掘技术方式实现对物资存量、风险的评估,在审计期间针对问题爆发之前采取相应的防范措施,达到早期防控的干预目的。

(二)工程结余物资取向

在数据来源方面,线上物资的需求需要基于提报、审计、收发货、结算以及利库等业务操作方式在SAP系统中进行操作,所以和相关数据源应当以结构化的方式进行处理,按照SAP系统数据进行处理。在结余物资的取向系统分析方面,工程结余物资线下可以基于仓储容量限制和物资管理单位的要求实现对库存物资的统一性管理,并基于线上不采取退回注册仓库的方式进行操作。随着结余物资的工程项目结决算关闭,保障物资结算时的准确性,在结余物资方面线上必须先退回原项目,在无法退回注册库时需要基于SAP系统应用不停寄存的方式应用于其他工程,对于电力企业而言,在建工程所有物资中过滤出全量工程结余物资属于数据挖掘审计模型中的核心,属于模型建设与应用的重点。对于在建工程的所有物资应当划分为两个方面,分别为藏匿的结余物资与工程实际使用物资。伴随着藏匿的结余物资持续流转,相对于工程实际使用物资与藏匿的结余物资有两个基本特征,分别是时间维度,结余物资形成之前已经结算关闭项目,藏匿的结余物资在系统中存在时间比较长和实际使用物资存在比较大的差异,此时可以借助设置库龄指标的方式进行区分[5]。另一方面在于空间维度,藏匿的结余物资流转在不同工程项目中,流转项目数量明显超过了实际使用的物资流转项目数量,此时可以设置流转项目并明确区分于实际物资的特征,借助聚类算法的方式实现对数据分组,并将其相似性保持最大化,按照相似性最小化的原则实现分组与聚类,并以两店的欧式距离作为聚类规范。

在结余物资总量方面,明确结余物资在SAP当中唯一取向属于在建工程的重点,借助筛查在建工程中所有物资的明细,结合物资的年龄、类型、冲转次数、移库次数等因素,计算出物资的库龄与流转项目数量并设置两个考核指标,构建藏匿物资的识别模型,借助聚类算法方式计算欧式距离内的物资库龄长和流转项目多的物资,明确结余物资的数量与明细,从而实现对整体物资风险的准确评估。在挖掘数据模型方面,需要基于藏匿在建工程的物资数量和金额,明确审计主体,同时借助聚类算法方式获得物资库龄与项目流转次数,同时明确物资交集,针对库龄数据与项目流转的明细实现数据的标准化处理,并通过SAP系统提供数据实现对相应数据的准确处理。

三、结语

综上所述,在审计工作环境之下大数据挖掘技术对于审计工作的影响显得越发突出和明显,为了更好的适应新形势,仍然需要不断的改进发展,特别是需要从数据质量、审计思路等方面进行不断的创新与改进,注重数据分析与数据挖掘的真实性以及数据高质量水平,在数据量不断增多的环境之下必然需要强化对系统数据的稽核,保障数据真实性,提升审计工作中数据质量水平,同时做好内部审计工作的多样化转变,按照不同审计目标采用针对性方式,应用统计学、分析性程序以及内控评审,提高审计工作精准度与数据分析与挖掘深度,从而确保电力企业综合经营水平。

猜你喜欢
结余数据挖掘审计工作
推动内部审计工作数字化的探究
会计集中核算制下的内部审计工作
基于并行计算的大数据挖掘在电网中的应用
医保基金结余和亏空并存
政府储备结余
一种基于Hadoop的大数据挖掘云服务及应用
降低医保基金结余刻不容缓
医保基金 结余和超支在博弈
基于GPGPU的离散数据挖掘研究