新一代城市商业银行审计数据集市的建设及应用价值研究

2021-10-12 17:34杜超
审计与理财 2021年7期

【摘 要】本文通过在数字化审计模式的基础上,讨论基于分布式数据库集群搭建的新一代审计数據集市对商业银行审计工作的意义、目标及作用。同时,进一步研究审计数据集市建设的具体流程,以及注意事项。最后,对审计数据集市的应用价值及成果转化进行了分析。

【关键词】数字化审计;数据集市;分布式数据库

一、新一代审计数据集市建设的意义

数字化审计是当前商业银行审计发展与改革的必然趋势。审计数据集市建设是数字化审计转型的基础性工作,对审计项目支撑、提升审计工作质效起到关键性作用。审计数据集市集全行主要业务系统、内控管理系统于一体,通过数据治理实现对全行业务及内控管控全貌的数字化展示,为全面审计提供了可能,为精准定位问题提供了线索,为业务发展精准营销夯实了数字化基础,为提升银行管理水平提供了快速路。

二、新一代审计数据集市建设的必要性

审计作为第三道防线,对全行内控风险管理起到最后一道屏障,堡垒战斗力的强弱直接影响城市商业银行的生命线。当前,城市商业银行在审计数据集市建设方面还不够。经调查分析,目前城市商业银行为业务发展均建立了数据仓库,主要目的是满足各业务部门发展需求提供业务查询、统计分析等数据,呈现涉及业务系统不多、数据表单不全的现状。同时,对风险管控及集团管理等关注较少,数字化建设不足,发力不够,应用不广。

三、新一代审计数据集市建设的价值

一是审计专业性更强,审计“桥头堡”更坚固。坚持以数据为驱动,以非现场审计为主导,以审计数据集市为依托,以审计数据化转型出成效为目的,在价值创造、科技引领等方面打造数字化审计及增值服务型审计优势,持续发挥战斗堡垒作用。

二是数字化程度更高,为决策管理提供更多审计智慧。通过对银行业务及管理系统的数据整合,在履行监督职责,为全行内控管理提供更多审计措施的基础上,依托审计数据集市,实现跨业务系统、条线、机构、环节、银行间数据的全面分析,为全行经营管理提供更多审计方案。

四、新一代审计数据集市建设的技术架构

新一代审计数据集市采用具有列存储MPP结构,使用完全并行的MPP+Shared Nothing分布式架构。通过采用多活Coordinator节点的两级部署结构,避免单点性能瓶颈和故障(SPOF)。硬件方面,完全使用底成本X86架构的PCServer。数据方面,支持多列hash分布、海量数据分布式压缩、数据加载高效性,并实现分区表管理、自定义函数、全文检索等功能。储存方面,具备支撑500个及以上节点的功能,同时单节点可支持50TB数据量。

五、新一代审计数据集市建设的数据库特征

基于数字化审计的模式下,审计数据库必须满足多种架构支持多类应用的要求,体现大数据时代的架构多元化特征,同时满足OldSQL、NewSQL和NoSQL之间的兼容性。以国产Gbase 8a MPP Cluster为例,它是在列存储、Shared Nothing架构的分布式并行数据库集群,具备高性能、高可用和高拓展特性。满足超大规模数据(TB-PB级)管理,并广泛应用于支撑各类数据仓库、BI和决策支持系统。

六、新一代审计数据集市建设主要过程

1.数据收集要齐全。针对数据仓库接入的系统不足、表单不全的现状,数字化审计必然要求新一代审计数据集市建设体现全面性特征。数据收集必须覆盖业务单元全、业务系统广。以某城市商业银行为例,审计数据集市建设需求阶段,要求实现对全行及集团子公司的业务系统及主要管理系统“应接尽接”,对业务条线板块及管理措施的相关数据全量加载,为切实打造大型数据审计集市提供了客观保障,为开展全面数字化审计奠定了坚实基础,为后续开展机器分析、智能审计搭建了丰富的数据“原料”。

2.数据整理要规范。由于商业银行涉及到的业务条线多,业务流程、模式及管理等均有差异,导致不同系统框架、系统流程、系统管理等不一致。同时,各系统的开发公司不同,加剧了系统数据库设计不规范的现象。商业银行数据治理方面缺乏数据信息化标准规范,导致各业务系统的表单数据“各成一家”。基于这种现状,审计数据集市必须开展规范管理,通过对贴源层数据全面梳理、共性特征数据字段统一规范,实现各业务系统数据格式一致,提升审计数据使用的便捷有效。

3.数据迁移要可靠。高效准确的迁移数据是新一代数据审计集市建设成功与否的重要衡量指标。以某一城市商业银行为例,已有的审计数据集市的数据迁移不稳定、迁移时间过长、通道带宽不足、数据规模受限、存储空间不足等缺陷,直接影响审计数据的自动跑批和高效应用。新一代数字化审计集市拟接入的业务系统较现有的翻两番,数据表单更是较目前1 500张表单翻6倍,庞大的数据量必然提出了数据迁移通道顺畅、网络带宽速率高、数据文件传输耗时短、数据存储设备足够等高要求。

4.数据加载要稳定。数据准确、及时、全面加载直接影响审计数据集市的质量,一是数据加载的及时性直接影响开展实时审计、风险预警监测等数字化审计工作,二是数据加载的全面性直接影响审计模型结果以及预警信号的完整。数据加载功能的稳定,一方面要求传输通道保持正常有效,尽量避开与其他多个数据任务共用同一通道,保障传输速度、减少数据丢失;另一方面要规范建立准确的数据存储过程以及加载方式,避免因逻辑及参数设置不合理导致调用及运行耗时过长。数据全量或者增量数据加载方式的准确界定,有利于全面完整展现审计数据,提高数据分析及利用效率。

5.数据加工要专业。对于接入审计数据集市的元数据,要及时开展数据质量分析。通过对数据格式、内容、加载时间等分析,整理内容为空、格式不规范以及过时的停用数据等冗余数据,制定好数据清理标准,并生成符合审计需要的格式化数据。字段加工方面,通过舍弃无用字段、统一字段类型以及对数据字段中内容为代码进行汉化等操作,实现数据字段的易读易用性。数据表单加工方面,通过实现业务主表和审计中间表等方式提高数据分析效率。业务主表主要采用对各业务表的整合,实现一张“宽表”,覆盖主要的关键字段要素,实现对业务的一键查询;通过对大表分拆、小表合并等方式生成审计中间表,提高数据查询效率。

6.数据推进要方略。打造审计数据集市过程,會面临一定的实际困难。以某商业银行为例,建设过程中,一是涉及的上游系统广,业务表多、数据量大,数据整理工作琐碎;二是数据采集、存储及批处理等环环相扣,容错率低,数据测试工作量大,工作要求严格;三是沟通成本高,涉及人员多、耗时较长。针对实际困难,为实现质量、效益和效率相统一,一是严把质量关,强化日常管理与主动参与;二是充分合理调动一切资源,降低沟通成本,实现协同效益;三是把握好时间节点,任务细化到每周、每日,有序推进。

七、审计数据集市的应用价值

1.完善审计模型,提升审计风险识别能力。

新一代审计数据集市,有助于提升审计人员非现场审计意识,强化审计模型创建能力,提升审计模型应用效果。通过向规章制度、数据分析、以往问题、经验等等措施持续丰富模型思路。一方面,增加国有大型商业银行、兄弟行以及行内业务条线部门风险模型库的思路,审计模型思路源泉更丰富。另一方面,模型类别更加立体,包括基础查询类、疑点类、统计类、业务指标类、增值服务类。审计模型数量及效果更加显现。以某银行为例,在实行数字化审计转型的形势下,制定了提出审计模型思路、思路评审、创建审计模型、质量评审等四步走战略,基本达到了预期效果。

2.健全预警信号,促进审计风险关卡前移。

新一代审计数据集市,为全面完善预警信号提供了数据保障。一是信号更全面。突破以往业务板块单一、信号老旧的困境,通过以风险为导向,解围业务系统限制,对辖属机构及集团子公司全面覆盖,对业务风险点全面渗透,与新业务、新手段、新方法高效融合。二是信号更可靠。基于MPP架构的分布式数据库平台,信号运行跑批不再受传统单机数据库影响,运行效率更快,用户体验效果更佳,数据运行更加安全可靠。

3.增强风控水平,延伸审计增值服务范围。

新一代审计数据集市,为打造数字化审计提供了强有力的武器。通过实现大数据的集中存储、批量调度、全面分析,进一步强化了用数效果,充分发挥数据价值,提升审计风险管控水平。一是继续强化对现场审计项目的支撑力度,二是充分应用于经济责任审计工作,三是充分应用于全行绩效考评工作,提高自动获取相关考核指标的范围;四是为业务机构经营管理情况画像提供数据参考依据,五是为条线部门及机构提供管理及业务咨询服务,为提升经营管理效果提供更多的审计措施,提升用数据决策、用数据管理、用数据说话的效果。

········参考文献·····················

[1]杜超.提升商业银行审计模型实效的几点措施[J].审计与理财,2020(11):21-22.

[2]《大数据技术在银行内部审计中的应用》编写组.大数据技术在银行内部审计中的应用[M].北京:中国时代经济出版社,2019.55-57.

[3]牛新庄.大数据技术在银行的应用与实践[J].清华金融评论,2017(8):28-31.

(作者单位:江西银行总行审计部)