构建行业通用、开源共享的审计大数据分析模型体系

2019-02-20 01:22隋学深审计署审计科研所审计署金融审计三局
审计月刊 2019年11期
关键词:数据模型审计局数据挖掘

◆隋学深/审计署审计科研所 黄 丰/审计署金融审计三局

大数据审计云平台、审计大数据标准体系是实现审计大数据分析的基础设施,审计大数据分析模型要素是发现审计线索、解决审计问题的直接生产工具,模型构建是否科学直接影响审计大数据分析的效果。科学审计模型的构建是一项科研性很强的工作,需要对审计业务的全面深入认识和对计算机实现算法的深刻理解,并将二者有机结合、高度统一。

一、审计大数据分析模型分类

(一)基于审计专家经验的查询类大数据分析模型

此类审计大数据分析模型依赖于审计实践中形成并已被证明有效的经验,是基于已知经验知识构建的大数据分析模型。基于对审计业务中实体间相互关系的全面清晰描述,将审计专家经验应用于审计大数据分析,形成SQL 语句等计算机执行语言构成的查询类大数据审计分析模型。通过查询类大数据审计分析模型实现审计专家经验的知识化、模型化,让经验以知识的形式得以固化和传播,以模型的形式得以快速推广和应用,产生实际的审计生产力。

(二)基于机器学习的数据挖掘类大数据分析模型

基于机器学习的数据挖掘类大数据分析模型发现的是事先没有已知经验的审计知识和规律,是机器学习算法通过对大数据中隐藏知识的挖掘,来发现审计线索和分析解决审计问题。

二、审计大数据分析模型构建

(一)基于审计专家经验的查询类大数据分析模型构建

一是对全国现有的基于审计专家经验的查询类大数据分析模型进行分类、改进和完善。按行业对现有的审计大数据分析模型进行分类整理。2004年至2012年,审计署连续开展了七届计算机审计专家经验和计算机审计方法征集工作,共征集评选出3683 篇计算机审计专家经验和计算机审计方法。2013年和2015年,审计署审计科研所开展了两次全国审计机关技术创新情况专题调研活动,出版了《审计技术创新发展报告及案例选编2013》《审计技术创新发展报告及案例选编2015》,分别发布了155篇和119篇审计技术创新案例。上述计算机审计专家经验、计算机审计方法和审计技术创新案例是多年来全国审计机关宝贵经验的积累和总结,可以对其进行更新和完善,构建种类比较齐全的基于审计专家经验的查询类大数据分析模型库。

二是目前可在审计专网建立审计大数据分析模型众创和共享平台,集全国审计人员智慧,不断添加新的大数据分析模型。在保证信息安全的前提下,可由全国审计人员在统一平台上,针对相同或相近的审计问题交流经验、共同开发、开源共享代码,充分发挥全国审计人员的积极性和创造性,推动构建具有时代性、实用性的审计大数据分析模型。

(二)基于机器学习的数据挖掘类大数据分析模型构建

一是以科研攻关的形式逐一攻克基于机器学习的数据挖掘类大数据分析模型构建难点。构建数据挖掘类大数据分析模型的门槛相对较高,需要对深度学习、支持向量机、人工神经网络、决策树、贝叶斯、最小二乘等算法的数学机理透彻理解,实现计算机语言的熟练运用,才能实现对审计大数据的分类、关联规则、聚类、时间序列等数据挖掘分析。这类数据分析工作本质上是科研创新工作,对数据、人员素质和科学组织管理的要求都较高,需要以科研课题、科研攻关的形式逐一明确问题、逐一立项,进行专项科研攻关来解决。

二是需要梳理和归纳可以通过数据挖掘模型解决的审计问题,构建人工智能审计问题库。目前的机器学习算法适合解决分类、关联规则、聚类、时间序列等问题。并不是所有的审计问题都能够使用机器学习工具分析,因此需要将基于机器学习的数据挖掘类和基于审计专家经验的查询类相结合,共同构成审计大数据分析模型体系。正是因为基于机器学习的数据挖掘类大数据分析模型有其特定的应用场景,需要系统地梳理审计业务问题,分门别类地构建出可以用机器学习工具挖掘分析的人工智能审计问题库。

三是需要在深刻洞悉审计问题和深入理解与审计问题相匹配的机器学习算法的基础上,进行大量数据分析实验,构建基于机器学习的数据挖掘类大数据分析模型。这项科研工作需要审计专家和大数据分析专家深度合作,将两个领域的知识有机结合起来,研究出切实解决实际问题、高效准确的大数据分析模型,为实现智能化审计添砖加瓦。

三、审计大数据模型构建实践经验总结

(一)成都市审计局大数据模型建设经验

成都市审计局整合现有的计算机审计分析方法,以大数据处理技术为手段,创新推出了一套大数据审计模型,让复杂的审计问题模型化,便于审计人员学习掌握和运用操作。在此基础上,进一步推出了自动化、形象化、可视化的数据分析功能,让审计人员能够直观地接受和使用大数据模型开展分析工作,提高审计发现疑点线索的能力。

成都市审计局通过搜索引擎式查询技术实现审计大数据分析低门槛化。除了将成型的各行业数据分析方法固化形成模型外,还将各区(市)县的审计模型添加到平台中,形成一套不断扩大的审计方法模型体系。目前已建立了部门大数据审计模型方法体系、企业大数据审计模型方法体系、专项资金大数据审计模型方法体系、自然资源资产大数据审计模型方法体系和区(市)县大数据审计模型方法体系,如温江区审计局开发了工程苗木及建材价格信息审计模块,崇州市审计局开发了工程造价审计模块,郫都区审计局开发了拆迁资金大数据审计模块等。

(二)杭州市审计局大数据模型建设经验

杭州市审计局大数据模型建设分为三类。

第一类是基础查询模型。杭州智慧审计系统共构建了公安户籍信息查询、财政供养人员查询、工商登记信息查询、社保信息查询等21个审计基础查询模型,这些审计基础查询采用固定输入输出格式的方式,操作简单,可实现单类审计信息的精确查询。

第二类是主题查询模型。审计主题库是指与特定审计视角相关的审计数据的集合。杭州智慧审计一期系统构建了法人、自然人和资金三个审计主题库,以企业法人、自然人和资金三个审计视角为数据维度,把杭州审计数据中心与其相关的审计数据归集在一起,形成审计数据集合。主题查询模型以固定格式向审计人员展示审计数据中心内与查询对象相关的所有数据,并提供数据关联查询入口,便于审计人员全面了解相关内容。

第三类是行业分析模型。杭州智慧审计一期系统围绕财政审计、部门预算执行审计、社保审计和国土审计等4 个重点审计行业构建了20 个常用审计分析模型,对财政审计、社保审计、部门预算执行审计等重点审计行业的历年审计方法进行分类汇总,提炼适用于同类审计事项的多个审计方法间的共同点,构建常用审计模型,实现同类审计问题的模式化分析。在常用审计分析模型上引入“表内列间计算”和“数据穿透”来实现对某一类问题“灵活”分析,增加常用审计模型的适用范围。

猜你喜欢
数据模型审计局数据挖掘
持续做好“后半篇文章:!
——赣州市审计局这样让困难群众感受温暖
九江市审计局开展“七个一”系列活动庆“七一”
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
理财杂志社2019年度优秀通讯员
面板数据模型截面相关检验方法综述
经济全球化对我国劳动收入份额影响机制研究——基于面板数据模型
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议
基于数据模型的编程应用