商业银行非现场审计系统知识图谱引擎的构建

2021-01-11 08:46涂志敏
中国商论 2021年1期
关键词:知识图谱商业银行

涂志敏

摘 要:商业银行内部审计注重挖掘数据之间的关联关系,知识图谱技术使得银行大量的数据以一种图关联的形式展现出来。本文基于知识图谱的应用研究,探讨现有非现场审计系统面临的困境,研究非现场审计系统知识图谱引擎的构建流程及应用场景。研究发现,知识图谱在商业银行内部审计应用中可对审计知识构建知识平台,也可在业务审计中对被审计对象进行关联关系挖掘。但目前仍需从数据治理,自然语言处理技术应用,提高内审人员能力等方面着手,以促进非现场审计系统知识图谱引擎落地。

关键词:商业银行;非现场审计;知识图谱

中图分类号:F830.33 文献标识码:A 文章编号:2096-0298(2021)01(a)--02

1 知识图谱研究综述

2012年5月17日谷歌公司正式提出知识图谱,引领了现代知识图谱的研究与应用。知识图谱将客观世界中真实存在的各种概念或实体及其之间的关系用语义网络图的形式表现出来,形成一种类人脑的知识库,提供了一种理解和管理海量信息的能力。2012年至今是知识图谱的快速发展期,目前知识图谱已广泛应用于搜索引擎、营销、医疗、电商、教育、司法、金融等领域。

对于知识图谱在金融行业的应用研究,张旭[1]指出,知识图谱技术落地金融行业需经历知识构建、知识计算、知识存储、知识应用等关键四个步骤;陈大值[2]针对商业银行当前面临的知识管理及应用问题,分析知识图谱的逻辑和技术框架及在银行业的应用场景;姚琥[3]提到农业银行以建设金融大脑为切入点,构建了知识图谱以应对当前互联网冲击下的商业银行信贷业务转型。

还有一些学者研究知识图谱技术在审计中的应用,但目前主要集中在医保审计工作中,如樊世昊[4]、周红宇[5]等,指出基于知识图谱的大数据审计方法可以有效解决医保审计中的数据分散、利用率不高、查询复杂度高、精确度低等问题,提高医保审计项目的质量。也有一些学者从技术层面研究知识图谱在审计中的应用,如王瑞萍等[6]基于Neo4j图数据库进行审计知识数据的清洗、知识三元组的构建、存储,并完成审计领域的知识图谱,有利于提高审计效率,挖掘不易发现的数据式审计证据。本文从商业银行内部审计非现场审计系统面临的困境出发,研究非现场审计系统中知识图谱构建流程、应用场景,及需要解决的问题。

2 现有非现场审计系统面临的困境

传统非现场审计系统已不能适应审计方式的变化。随着金融科技在各领域的应用领跑,内部审计方式方法产生了前所未有的变化,传统的内部审计模式与手段明显已不符合当前的审计形势。以往的非現场的审计系统仅可支持现场审计环节信息的录入与传阅,在审计查询功能方面仅支持小范围数据的查询,模型建设也不够完善,对于关联关系的深度挖掘主要靠审计人员的经验判断。

传统非现场审计系统已不能满足审计业务需求。数据已经成为商业银行重要的资产,有效提升数据资产应用是关键。商业银行内部审计是数据应用部门,主要工作是通过数据分析与挖掘,建立风险评估方法论和可量化的内控评价指标体系,前瞻性识别内控缺陷,提升内控有效性。而非现场审计系统是内部审计人员进行审计依托的主要系统,在当前大数据审计时代其在整合内外部数据资源、数据建模等方面存在劣势,极大地影响审计的效率和质量。

随着商业银行结构化数据的日益积累,半结构化及结构化数据的提取技术的快速发展,商业银行金融数据呈指数级增长。要适应新形势下的审计变化,必须加强审计数据应用基础,对非现场审计信息系统及模型工具进行优化,充分运用科技手段提升非现场审计效率。知识图谱的构建是实现数字化审计的基础工程,要解决目前非现场审计的困境,在非现场审计系统中对多源异构数据构建知识图谱是必经之路。

3 非现场审计系统知识图谱引擎的构建研究

知识图谱的构建分为自底向上法和自顶向下法,谷歌知识图谱架构采用的就是自底向上法,包括数据获取、知识抽取、知识融合、知识加工等环节。其中,数据获取包括结构化、半结构化数据、非结构化数据;知识抽取包括实体提取、关系提取、属性提取;知识融合包括对结构化数据和第三方数据库的知识融合,及半结构化数据和非结构化数据的共指解析和实体消歧;知识加工包括本体构建、知识推理和质量评估,最后形成知识图谱。

商业银行非现场审计系统知识图谱的架构与自底向上法的架构基本一致,但也具有商业银行自身的特色。构建的主要环节包括数据收集、数据组织、数据标识、数据关联等环节。第一步是数据收集,根据业务需求,明确数据来源、更新频率等,将多源异构数据提取并接入数据中心;第二步是数据组织,对清洗过的数据按照统一的数据标准进行分库管理,包括知识库、资源库、业务库等;第三步是数据标识,根据标签对数据、文本信息进行比对,并为其打上标识,为后续应用奠定基础;第四步是数据关联,对数据进行知识提取,并挖掘实体、关系、属性间的深度关联,形成知识图谱。

4 非现场审计系统知识图谱引擎的应用场景

知识图谱应用的首要环节是确认业务需求,即模型开发过程中的业务场景的选择,主要是涉及关系分析的场景,本文主要分析涉及内部审计知识管理的知识平台和业务审计中的应用。

4.1 知识平台

知识图谱的基础应用需求来源于对知识的管理,商业银行内部审计也存在知识管理的需求。知识平台实质就是一种文本知识图谱,将文本作为研究对象,采用知识推理和知识标识等分析文本知识。每个审计项目都要经历审计准备、审计实施、审计报告、后续审计四个阶段,存在大量的重复劳动,耗费审计资源,也体现了审计机构内部对审计知识管理不到位。内部审计知识平台整合审计工作中的各类审计报告、具体审计问题及审计依据等,通过知识图谱技术将内部审计中的实体、属性和关系进行梳理并建立逻辑关联,实现具体审计方案自动生成,审计风险点与制度依据关联,知识智能问答等多层面的需求解决方案,解决同一问题定性引用制度五花八门,同一审计重点的关注点千差万别等问题。根据建立使用目标不同,可以分为审计方案库、审计风险库、审计制度库等。

4.2 审计应用

商业银行业务审计按照被审计对象划分,可以划分为对人的审计和对事的审计,即经济责任审计和业务审计,在两类审计过程中,都可以考虑构建知识图谱来提升审计质效。

4.2.1 经济责任审计知识图谱

对于经济责任审计中存在的画像不够准确,责任界定不清晰等问题可以依靠知识图谱来提供清晰的关联关系。被审计对象经济活动的横纵向分析,业务问题的关联性分析,应承担的责任类型都可以通过基于知识图谱的知识库来直观展现。一是从个人履历、各阶段分管业务、业务的横纵向对比数据、相关的内外部检查问题等设置关联规则;二是对以往审计发现的问题,与被审计对象决策能力、经营能力、执行能力、廉政能力相关的维度进行责任界定;三是基于经济责任履行能力评价指标体系、政策制度等形成知识库。通过经济责任审计知识图谱,可以为被审计人员“画像”提供更齐全的素材。

4.2.2 风控领域知识图谱

(1)信用风险防控。面对复杂的市场环境以及企业间多重的关联关系,审计人员若通过传统审计手段对其中的关系进行抽丝剥茧,耗时耗力且容易存在误差。金融监管的要求越来越高,银行业金融机构面对自身快速增长的数据,如何在海量的关联数据中识别出企业潜在的风险。内部审计人员必须借助科技的力量,提升多源异构数据处理和分析能力,从企业级数据中获取完整的企业关系网及资金流转关系,准确挖掘企业间千丝万缕的关联关系,识别出潜在的信用风险。目前商业银行内部审计需要集成的企业外部数据包括工商、投资、诉讼、担保等;实体包括自然人、账号、机构、合同、押品等;属性包括ID、姓名、身份证号等;关系包括员工与授信客户、外包商关联、融资担保关联等,从而防范多头授信、重复抵押、担保圈、围标等外部欺诈风险。

(2)洗钱风险防控。传统关系型数据库的反洗钱模型通常只能关注1度的交易行为,在当前海量客户数据、账户交易数据面前显得力不从心。知识图谱技术可以通过交易数据挖掘账户之間的关联关系,并构建拆分模型、汇聚模型等反洗钱模型,通常可以进行5度分析范围的数据分析,对客户账户进行深度分析与管理。相较于传统的反洗钱模型,基于知识图谱的反洗钱模型能进行更深层次的关联关系,更有效地防范洗钱风险。

5 知识图谱在商业银行内部审计中的应用展望

知识图谱技术应用到商业银行内部审计工作中,能有效提升非现场审计的工作效率和质量,但鉴于知识图谱技术应用到审计领域还处于初级尝试阶段,能够成功落地实施还需要解决一些实际的问题。

5.1 提高源数据质量

知识图谱构建时涉及多系统数据的融合,商业银行系统存在分时分阶段建立的特点,多个系统之间采用不同的数据标准或技术规范,导致数据不一致,数据质量较差。知识图谱其实是一种基于数据融合应用的分析技术,数据从孤岛状态走向数据融合,必须要对数据进行分类归集、开放共享等形成良好的数据资源管理体系,做好数据治理。

5.2 强化自然语言处理技术的应用

自然语言处理(NLP)是知识图谱的关键技术,主要研究人与计算机之间使用人类自然语言进行有效沟通的理论和方法。NLP最常应用于知识图谱中的能力是对自然语言中信息的抽取,通过分词、词性标注和句法分析等方式完成对自然语言到实体、关系、属性的知识抽取。NLP技术在商业银行非现场审计系统中的落地实施,是各类知识图谱构建的关键。

5.3 加强内部审计人员能力培养

金融科技赋能内部审计,同时也对内部审计人员的能力提出了更高的要求。内部审计队伍的知识结构、能力素质难以在短期内全面适应数字化转型的工作需要。内部审计人员不仅是非现场审计系统的被动使用者,更需要发挥主观能动性积极提升自身数据分析能力、新技术应用能力、模型研发使用能力等。

参考文献

张旭.知识图谱技术落地金融行业的关键四步[J].金融电子化,2017(11):92.

陈大值.知识图谱在银行业的应用场景及可行性研究[J].中国金融电脑,2019(02):31-35.

姚琥.“AI+知识图谱”在信用风险管理领域的探索[J].金融电子化,2019(05):55-57.

樊世昊. 基于知识图谱的审计方法研究[D].南京:南京审计大学,2018.

周红宇. 知识图谱在医疗保险基金审计中的应用研究[D].南京:南京审计大学,2019.

王瑞萍,刘峰,杨媛琦,等.审计知识图谱的构建与研究——基于Neo4j的图谱技术[J].中国注册会计师,2020(09):109-113.

猜你喜欢
知识图谱商业银行
2020中国商业银行竞争里评价获奖名单
2019年农商行竞争力评价报告摘要
基于因子分析法国内上市商业银行绩效评
基于因子分析法国内上市商业银行绩效评
2018中国商业银行竞争力评价结果
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析