机器学习：风险管理和合规的革命

2018-08-17 13:43黄洲丹

商情 2018年37期

黄洲丹

【摘要】本文主要分析大量数据的机器学习方法以及金融服务领域内的机器学习方法的应用，介绍机器学习的背景和机器学习方法的概述，对机器学习的使用领域进行探索，讨论金融机构内的若干应用案例：信用风险模型，信用卡欺诈和洗钱检测以及监控金融机构违反行为标准的行为。

【关键词】机器学习深度学习信用风险与收益模型信用卡欺诈反洗钱

一、前言

机器学习是一个人工智能领域，它使用算法，允许计算机无需編程即可学习。机器学习有两种形式：监督和无监督。在有监督的机器学习中，建立统计模型以便基于特定输入预测结果（例如，基于各种宏观经济变量的输入预测GDP增长）；在无监督的机器学习中，执行数据分析以识别模式而不估计因变量。

机器学习很重要，因为它可以分析数据样本，以便识别数据中的模式和关系，并可以进行样本外预测，然后对模型进行数千或数百万次分析，以便模型可以提高其预测能力。在这方面，机器学习与“大数据”革命密切相关。有监督的机器学习还可以分析非参数和非线性关系，这些关系可以适合任何给定的模型并对依赖变量和自变量进行推断。

机器学习主要应用于三大类统计问题：回归，分类和聚类。回归和分类都可以通过有监督的机器学习来解决，而聚类则遵循无监督的方法。回归问题可以预测定量的连续变量，包括通货膨胀和GDP增长；分类问题对离散的因变量进行预测，例如过滤垃圾邮件和血液类型；聚类涉及观察输入变量而不包括因变量，例子包括反洗钱分析。

二、深度学习

深度学习方法远离我们迄今为止讨论的“经典”模型方法，经典模型专注于定义明确的结构化数据集，而深度学习则通过在学习过程中应用多层算法并转换原始数据来识别复杂模式，从根本上模仿人类大脑。每种算法都关注数据的特定特征（称为表示），并且这些表示的分层允许模型包含各种输入，包括低质量或非结构化数据。重要的是，这些层不是由工程师设计的，而是由模型从各种数据中学习的。

例如，深度学习已被用于面部识别和自然语言学习模型，模型已足够复杂，不仅能够对讨论主题进行分类，还能够对所涉人员的情绪进行分类。然而，深度学习模型非常复杂，通常需要数百万或数亿个数据集。

三、机器学习的应用

金融机构处理他们需要分析的大量数据，这需要复杂的分析工具。为响应新的法规和合规措施，在2007 - 2009金融危机之后，金融机构需要报告更全面的资产负债表指标和业务模式细节，进行压力测试以及流动性测量，对资本和抵押品进行报告。

金融机构还面临着来自消费者应用程序，社交媒体供稿和各种系统元数据输出的大量低质量，非结构化数据（称为大数据）。机构能够有效地分析这些大量数据变得越来越重要，包括使用传统的机器学习技术以及更复杂的深度学习技术。金融机构应使用传统的机器学习技术来挖掘高质量的结构化监管数据，深度学习和神经网络应该用于低质量，高频率，“大数据”类型的源。

（一）信用风险与收益模型

金融机构最近采用机器学习方法和传统模式来提高他们预测金融风险的能力，他们逐渐摆脱了不那么复杂的传统线性信用风险模型回归。但是，机器学习模型往往不适合成功地纳入金融机构的持续风险监控，机器学习模型可能过于复杂并且对过度拟合数据敏感。它们的（通常是极端的）复杂性使得难以应用管辖一致的数据定义，并且模型对于监管目的而言过于复杂，包括基于巴塞尔内部评级（IRB）方法的内部模型也是如此，审计员很难了解他们。尽管存在缺点，但机器学习模型可以成功地用于优化具有监管功能的现有模型。例如，线性和较不复杂的非线性机器学习模型都可以应用于现有的监管和收益预测模型。

（二）欺诈

银行已成功将机器学习用于检测信用卡欺诈，信用卡欺诈可以比其他风险领域更有用地结合机器学习，因为模型的培训，回测和验证需要大量的信用卡交易。模型还可以通过无监督的学习方法（如聚类）成功地用于反洗钱或打击资助恐怖主义活动，但难以仅使用历史数据来训练洗钱检测算法以检测欺诈活动。

（三）交易中行为和市场滥用的监督

对交易者违规行为的监控是另一个不断增长的领域，其中机器学习越来越多地用于检测流氓交易，内幕交易和基准操纵活动。金融机构发现这些违规行为的早期发现很重要，因为它们可能对机构造成重大的财务和声誉损害。

金融机构成功应用机器学习所面临的挑战之一包括与开发人员共享过去违规信息的法律复杂性。此外，系统需要是可审计的，但由于机器学习模型旨在不断从数据中学习，因此很难向合规官员解释为什么某个行为会引发警报。作为对这些问题的补救，可以设计系统以将机器学习与人类决策相结合。通过将人类决策与机器学习相结合，系统数据可用于了解有关交易者的全面信息，并创建一个不太复杂且更适合审计和监管目的的系统。

四、小结

如今，机器学习和人工智能是金融服务领域的重要课题。金融机构正在寻求更强大的分析方法，以便管理和挖掘越来越多的监管报告数据和非结构化数据，用于合规和风险管理或为了与其他金融机构和金融科技公司有效竞争。

机器学习方法具备分析大量数据的能力，同时提供深度的预测分析，可以提高金融机构中风险管理和合规领域的分析能力。例如，检测付费系统中复杂的非法交易模式以及更准确的信用风险建模。机器学习方法在金融服务领域的应用高度依赖于环境，金融机构并不总是提供用于培训或分析的高质量数据。更重要的是，几种方法的分析的预测能力可能以增加模型复杂性和缺乏解释性洞察力为代价，这是需要改进的地方。

参考文献：

[1] Van Liebergen， Bart，“Machine Learning：A Revolution in RiskManagement and Compliance" Institute of International Finance，April 2017.

[2]彼得·哈灵顿著.李锐，李鹏，曲亚东，王斌，译.机器学习实战[M].北京：人民邮电出版社，2013.

[3]贺建清.金融科技：发展，影响与监管[J].金融发展研究，2017（06）.