基于GBDT模型的P2P网贷平台运营风险预警研究*

2020-06-01 11:38王小俐魏建国梁方瑞
关键词:网贷数值预警

王小俐,魏建国,梁方瑞

(武汉理工大学 经济学院,湖北 武汉430070)

一、引 言

图1 P2P网贷平台成交量和资金净流入的变化趋势图

近年来,我国大量P2P网贷平台倒闭和跑路,由此严重损害了投资者利益,妨碍了网贷行业的健康发展。据“网贷之家”统计①,截至2019年12月底,P2P网贷行业累计成交量为8.99万亿元;P2P网贷行业正常运营平台的合计贷款余额总量为4915.91亿元,环比下降9.10%,同比下降37.69%;P2P网贷平台的数量累计达6613家,但正常运营平台数量仅343家,仅占比5.19%。随着大量不合规平台相继退出市场,平台交易受到严重影响。图1显示近5年P2P网贷平台的成交量和资金净流入情况。由图1可以看出,两项指标的数值从2014年12月到2016年12月均处于上升期,均在2016年12月达到最大值,即成交量和资金净流入分别为2443.26亿元和375.34亿元,随后均逐年下降。资金净流入在2018年12月降为负值,这与大量不合规平台退出市场密切相关;而成交量在2019年底保持在428.89亿元,反映了P2P网贷平台在满足社会资本的融资需求方面仍然发挥着重要作用。

大量P2P网贷平台倒闭或跑路有多方面的原因,其中一个重要原因是许多平台的运营管理能力低下,抗风险能力弱。对网贷平台运营风险进行评价和做预警研究,有助于投资者和借款人正确选择平台,识别平台风险,减少损失,也有利于促进平台提高运营管理能力,降低风险发生概率。

二、相关文献综述

关于P2P网贷平台运营风险表现与成因的研究。有学者指出,P2P网贷平台运营风险主要表现为挤兑风险、涉嫌违法犯罪、提现困难、停业、跑路和破产等[1-2]。学者们从不同角度探讨了P2P网贷平台发生运营风险的影响因素,如:平台背景和资本实力、平台自我监管和风控水平、行业竞争影响平台生存和运营状况[3];平台的信息透明度、品牌影响力、承诺收益率与运营模式[4-5];声誉、高管背景、有无债权转让和有无银行存管[6]。

关于P2P网贷平台风险评价指标的研究。有学者用注册资本、平台背景、注册地点、是否有资金托管等12个指标变量反映平台的风险特征[7];或用平台热度、借款情况、生存能力和投融资集中度四个指标描述平台的风险特征[8]。经实证研究发现,违约风险集中度、资金净流入和发展速度等指标对平台正常营运有积极作用[9],资金存管、ICP经营许可证、等保三级和信息披露这些指标可以反映平台的合规化情况[10]。

关于P2P网贷平台运营风险预警模型的研究。有学者认为,基于随机森林、贝叶斯网络模型的信用评价模型在预警P2P网贷行业风险方面效果显著[11-12];严武[13]将平台风险作为切入点,对比以逻辑回归和决策树为代表的传统模型与以随机森林和XGBoost为代表的前沿模型在P2P网贷平台风险预警方面的效果,发现前沿模型的预警准确率更高。

综上,学者们从不同角度对P2P网贷平台运营风险问题作了研究,但是学者们提出的运营指标往往依据不足或不够全面,难以准确反映平台运营特征,还没有从运营风险成因的角度构建指标体系,提出的风险预警模型的有效性和准确性高低有别,还有改进的空间。本文运用委托代理理论分析P2P网贷平台运营风险的成因,从平台运营管理能力角度建立P2P网贷平台运营风险预警指标体系,构建平台运营风险GBDT预警模型,使用交叉验证方法处理样本数据中正负样本比例不均衡的问题,以提高模型的预测性能。

三、P2P网贷平台运营风险及其预警指标体系

P2P网贷平台运营风险是指平台在运营过程中由于平台自身实力不强,运营管理不善,借款标的物选择不当等原因,给平台带来经济损失的一种可能性。相对于P2P网贷平台而言,借款人是委托人,委托平台发布借款信息;平台作为代理人,负责审核借款人的信用信息、评估借款人风险等级。相对于P2P网贷平台而言,投资人作为委托人,委托平台发布贷款信息;平台作为代理人,负责向社会发布贷款信息,向投资人提供借款人和项目的信息。通过撮合借款人和投资人成交,平台赚取中介费作为盈利。由于平台主要根据借款人在网上提供的相关信息进行信用评价,平台与借款人之间存在着严重的信息不对称。借款人往往会刻意隐瞒借款的真实用途,夸大自身的信用等级,获得贷款后有可能将资金挪作他用。若平台的运营管理能力差,则平台难以对借款人信息的真实性和风险等级进行有效评估。当大量借款人发生逾期或违约行为时,平台就可能会产生运营风险。随着平台财务状况恶化或者同业竞争压力增大,平台会刻意隐瞒不良信息,向借款人收取更高的利息来弥补损失,由此会进一步加重平台的运营风险。

基于数据的可获得性,同时为了对不同网贷平台进行对比分析,本文对市场环境风险和法律风险等平台外部因素不予考虑,只是从平台运营管理角度出发,从平台实力、平台风控能力、平台运营能力、平台治理水平、平台合规性、标的特性与收益率等六个维度构建平台运营风险预警指标体系。

1.平台实力:反映平台应对风险的能力,用注册资本和平台背景来衡量。注册资本是平台在登记机关登记注册的资本数值,注册资本越高则平台实力越强;若平台具有国资、上市公司、银行系或风投系背景,表明平台实力较为雄厚,否则实力较为薄弱。平台实力越强,则运营越稳健,出现运营风险的可能性越低。

2.平台风控能力:反映平台对风险甄别和防控的能力,用高管经验和高管学历来衡量。高管经验用具有金融从业经验的高管人数来衡量,高管人数越多,表明平台高管经验越丰富,对复杂的金融市场和金融环境了解越透彻,分析处理问题的能力越强;高管学历用具有硕士以上学历的高管人数来衡量,这类人数越多,反映高管学历越高,他们具备的金融理论知识更丰富,行业认知能力和战略决策能力越强。平台风控能力越强,表明平台抵御风险的能力也越强,出现运营风险的概率越低。

3.平台运营能力:反映平台内部管理、资金运转和对抗风险的能力,用平台运营时间来衡量。平台运营时间越长,反映其管理模式越完善,抗风险的经验越丰富,长期抗风险能力越强,出现运营风险的概率越低。

4.平台治理水平:反映平台保障投资者利益和维持平台稳健运行的能力,用平台是否进行资金托管、是否进行投标保障和是否进行充分的信息披露来衡量。资金托管是指平台将投资人的资金委托第三方账户管理;投标保障是指平台对投资人的资金采取的通过风险准备金进行补偿或者第三方担保公司提供担保的一种保障措施;信息披露是指平台对借款人和项目的信息披露情况。平台若进行资金托管、投标保障和充分的信息披露,则其治理水平越强,出现运营风险的概率越低。

5.平台合规性:反映平台运行是否符合监管标准,用平台是否加入监管协会、是否具有ICP经营许可证、是否加入第三方征信来衡量。若平台加入了监管协会、具有ICP经营许可证、加入了第三方征信,表明平台接受外部监管的力度越大,运营将更加合规,平台出现运营风险的可能性越低。

6.标的特性与收益率:反映平台对借款用途的评价能力,借款标的好坏直接影响平台收益水平,用标的期限长短、标的类型多少、平台收益率高低和风险项的数值来衡量。标的期限越短,平台越容易出现短期兑付危机,进而引发平台风险;标的类型越多样,越能够分散不同类型借款人的违约风险,从而降低平台风险;平台收益率超过一定范围后的数值越高,越能反映平台处于资金短缺状态,即平台可能存在诱导投资人投资的资金诈骗行为;平台风险项的数值越高,则平台在运营过程中暴露的风险越高。平台标的期限越短、标的类型越单一、收益率越高、风险项数值越高,则平台的运营风险也越高。

表1 平台运营风险预警指标体系

在这六个维度下,根据P2P网贷平台的可观测数据,本文将这些指标进一步细分为注册资本、后台背景和高管经验等15个二级指标,构建如表1所示的平台运营风险预警指标体系。将正常运营平台定义为正常平台,赋值为1;将倒闭跑路等平台定义为出险平台,赋值为0。将不同变量用符号Xi(i=1,…,15)表示。

四、基于GBDT模型的平台运营风险预警

(一)数据处理

本文收集了信息披露较为完整的358家网贷平台的相关数据(见表2),其中正常平台258家,出险平台100家,时间截至到2019年12月底。数据来源于“网贷之家”、“网贷天眼”和企查查。下面将以注册资本(X1)、运营时间(X5)、信息披露(X8)和ICP经营许可证(X10)为例对表2的变量进行描述性统计说明。就注册资本而言,正常平台的平均值(12 978.56万元)高于出险平台(10615.30万元),但其最小值、最大值和标准差均要低于出险平台;就运营时间而言,正常平台和出险平台的平均值差额达到18个月,正常平台的最小值和标准差低于出险平台,但最大值高于出险平台,表明正常平台的运营时间更长;就信息披露而言,正常平台和出险平台的数值分别为1.78和1.01,表明正常平台的整体信息披露更多;就ICP经营许可证而言,正常平台和出险平台的最小值和最大值数值相同,但正常平台的平均值和标准差都要略低于出险平台。

为了消除量纲不同带来的差异,对注册资本(X1)、运营时间(X5)等两个连续型变量以及高管经验(X3)、高管学历(X4)和信息披露(X8)等三个离散型变量进行Min-Max标准化处理。对正向指标和反向指标的处理方法如公式(1)和(2)所示:

(1)

(2)

(二)预警模型和评价指标说明

1.GBDT模型。

GBDT模型是由Freidman提出的一种将学习到的多种模型进行集成的机器学习算法。它由多棵决策树组成,在训练的过程中可以通过降低偏差来提高最终分类器的精度,核心是累加所有树的结果作为最终结果。其中,每棵树学习的是之前所有树的结论和残差。假设x和y分别表示P2P网贷平台运营风险的输入指标和输出指标的数值。将其算法列出如下②:

输入:训练数据集T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈χ=Rn,yi∈γ={-1,1},i=1,2,...,N;

输出:回归树fM(x)。

第二步:对于m=1,2,…,M,

对rmi拟合一颗回归树,得到第m颗树的叶节点区域Rmj,j=1,2,…,J,即一颗由J个叶子节点组成的树,来拟合残差的近似值;

2.预警效果评价指标。

作为机器学习模型中常见的评价指标,准确率、精确率、召回率和F1值将被用于评价预警模型的预测效果。这些指标的数值越高,则模型的分类精度越高、泛化能力越强。其中,平台表现为正常平台或出险平台为二分类问题,可以用数据标签1或0表示。将多数类定义为正,少数类定义为负,其混淆矩阵见表3。由此可以得到:

准确率(用A表示)表示正常平台和出险平台被正确预测的样本个数占样本总数的比率。它的数值越高,则模型的预警效果越好。其中A=(TP+TN)/(TP+FP+TN+FN)。

精确率(用P表示)是指在所有预测为正常平台的样本中实际为正常平台的样本比率。它的数值越高,则模型的预警效果越好。其中P=TP/(TP+FP)。

召回率(用R表示)是指在所有实际为正常平台的样本中预测为正常平台的样本比率。它的数值越高,则模型的预警效果越好。其中R=TP/(TP+FN)。

F1值是精确率和召回率的加权平均数。它的数值越高,则模型的预警效果越好。其中F1= (2×R×P)/(R+P)。

表3 混淆矩阵

(三)实证对比分析

为了全面评估基于GBDT模型的P2P网贷平台运营风险预测性能,下面选取逻辑回归(简称LR)、决策树(简称DT)、支持向量机(简称SVM)、随机森林(简称RF)、多层感知器(简称MLP)等五种主要的机器学习模型,就风险预测效果进行对比分析。实验的操作环境为python3.7,依赖的数据库为sklearn和pandas。

首先基于原始数据集来对比分析不同机器学习模型的预测性能。按照70:30的比例将原始数据划分为训练集和测试集,列出六种不同机器学习模型的预警结果见表4。由表4可知,与其他机器学习模型相比,GBDT模型的预测准确率、精确率、召回率和F1值都处于整体最高水平,数值分别为95.37%,94.19%,100%和97.01%;DT模型的预测性能紧随其后,准确率、精确率、召回率和F1值分别为94.44%,94.12%,98.77%和96.39%,预测效果较好;而SVM模型虽然召回率值为100%,但准确率、精确率和F1值分别为75%,75%和85.71%,在六个预警模型中数值为最低,表明其预测效果相对较差。由此可以看出,GBDT模型具有很好的预测性能。

表4 原始数据集中不同机器学习模型的评价结果

注:加粗值为同一评估方法下的最大值

然后采用k折交叉验证来对比分析不同机器学习模型的预测性能。在原始数据集中正常平台和出险平台的数据量之比为2.58:1,样本类别比例存在不均衡问题,可能导致最终的预测结果向多数类样本倾斜。为了防止数据出现过拟合或者欠拟合情况,下面本文以k折交叉验证方法为基础,在不同交叉验证折数下采用GBDT等六种机器学习模型进行预警分析。其中,k折交叉验证是指将样本数据集划分为k组,轮流将k-1组作为训练集,剩下1组作为测试集,将实验重复做k次,取k次结果的平均值作为实验结果。该方法可以降低泛化误差,同时避免过学习和欠学习状态的发生。

分别取折数k=5,10,15,20,25,可以得到这六种机器学习模型下各个预警评价指标的数值。将折数作为横轴、预警评价指标值作为纵轴,绘制如图2所示的折线图。由图2(a)到图2(d)可以直观看出,随着交叉验证折数的变化,各大模型的评价指标值都呈现一定的波动性;GBDT模型、RF模型和DT模型的曲线走势图呈现相似的变化规律,即当折数k由5变化到25时,它们的取值都在95%上下浮动,排名均位于前三名,而且在数值上远高于其他三个模型,其中使用GBDT模型来预警的评价指标值在六个模型中都位于前列;而LR模型、SVM模型和MLP模型的曲线走势图也呈现相似的变化规律,即当折数k由5变化到25时,它们的取值均在80%-95%之间波动,排名均位于后三名。综上,在不同折数下,GBDT模型的准确率、精确率、召回率和F1值基本上都取得最大值,这表明GBDT模型具有非常好的预测性能。

图2 不同折数下六种机器学习模型的评价指标值的折线图

接下来取不同交叉验证折数下各预警指标值的平均值,可以得到这六种机器学习模型的预警结果。将k=5,10,15,20,25时四大评价指标的平均值列出如表5所示。

表5 采用交叉验证的六种机器学习模型评价结果平均值

注:加粗值为同一评估方法下的最大值

根据表5可以看出,GBDT模型的预警准确率、召回率和F1值在所有模型中均取得最大值,数值分别为95.63%,98.69%,97.16%,与同一评价指标下预警结果的最小值之差分别为13.14%,8.27%和9%;而GBDT模型的精确率数值(96.05%)比DT模型(96.09%)略低0.04%,在六大模型的预警结果中排名第二;其中,DT模型和RF模型也都具有较好的预警效果,前者的准确率、精确率、召回率和F1值分别为94.13%,96.09%,96.20%,95.96%,而后者的数值分别为93.18%,94.29%,97.31%,95.52%。总体而言,与其他预警模型相比,GBDT模型具有很好的预测性能。

最后对比表4和表5可以看出,采用k折交叉验证方法之后,SVM模型、RF模型和GBDT模型除了召回率略低外,准确率、精确率和F1值均得到提升,GBDT模型仍然具有较好的预警性能;而LR模型和MLP模型的各大评价指标数值均有小幅度降低;DT模型的精确率获得提高,然而其他指标的数值有所降低。总体来说,采用交叉验证方法处理数据后,六种机器学习模型预测性能都有所提高。

五、结论与建议

根据数据分析,本文得出如下结论:第一,网贷平台的运营管理能力是决定平台运营风险的关键因素之一,可以从平台实力、平台风控能力、平台运营能力、平台治理水平、平台合规性、标的特性与收益率六个维度来衡量网贷平台的运营能力,为运营风险评价提供依据;第二,通过对选取的358个网贷平台的样本数据做预警实证研究发现,与逻辑回归和决策树等另外五种常用的机器学习模型相比,GBDT模型具有很好的预测性能,对P2P网贷平台运营风险的预警准确率达到95.63%,预警的精确率、召回率和F1值也显著优于其他模型;第三,在采用k折交叉验证方法对样本数据集进行处理后,这六种机器学习模型的预测性能得到明显提升,其中GBDT模型的准确率、精确率和F1值提升显著。

据此,本文就管理和预警P2P网贷平台运营风险提出如下建议:

第一,完善平台信息披露机制。我国银监会在2016年颁布的《网络借贷信息中介机构业务活动管理暂行办法》对平台应披露的指标信息作出了明确规定,但对平台运营指标的信息披露方面还存在不足,在数据的计算和处理方面没有给出统一的标准。可以借鉴我国商业银行和上市公司的信息披露标准,在不涉及商业机密的情况下,要求平台及时公布运营数据,向投资人真实披露平台风险状况;建立统一的数据采集标准,确保不同平台的数据之间具有可比性,进而提高预测准确率。

第二,建立平台运营信息数据库。准确全面的平台运营信息是运营风险预警的基本保障。目前我国还没有建立专门的P2P网贷平台数据库,有关方面获取数据主要依赖于第三方网站,如“网贷之家”和“网贷天眼”。建议由政府部门或网贷行业协会牵头建立平台运营信息数据库,定期收集、汇总和公布平台运营数据,为网贷风险预警管理和网贷行业监管提供基础条件。

第三,提高平台运营管理能力。规范平台内部管理结构,优化平台股东治理结构,加强股东大会、董事会、监事会和经理层之间的协同管理,明确平台各部门的职责和范围;加强平台内部的风险控制体系建设,建设一支由具有丰富从业经验和专业知识的人员组成的风险控制团队,加强风险控制技术研发、学习和应用,提高平台的风险甄别和防控能力;提高平台从业人员的专业能力和综合素质,增强风险意识,建立定期培训和考核评比淘汰制度,提高他们在复杂金融环境中的风险分析和决策能力。

第四,加强对网贷行业的监管创新。在全国性监管部门制定的监管标准和规范指导下,地方性监管部门可结合当地实际状况制定实施细则和具体规定,推进监管政策创新;加强中央与地方之间的信息沟通与共享,加强大数据、区块链、人工智能技术在网贷监管中的应用,推进监管技术创新;健全行业自律监管机制,要求全部网贷平台参加网贷行业协会,纳入行业监管范畴,引导平台积极响应监管措施;目前负责P2P网贷监管的地方金融局,可以与银监会、第三方支付、托管商业银行和其它社会中介机构合作,建立P2P网贷监管联盟,对网贷平台运营过程实施全面的监督管理。

注释:

① 数据来源:P2P网贷行业2019年12月月报https://www.wdzj.com/news/yc/5533102.html。

② “机器学习笔记”GBDT原理https://blog.csdn.net/shine19930820/article/details/65633436

猜你喜欢
网贷数值预警
体积占比不同的组合式石蜡相变传热数值模拟
预警型智能包装在食品安全中的应用和设计
数值大小比较“招招鲜”
超级秀场 大风预警
舰船测风传感器安装位置数值仿真
铝合金加筋板焊接温度场和残余应力数值模拟
P2P网贷中的消费者权益保护
网贷平台未来亟需转型
网贷十年:迎来“去伪存真” 时代
中国网贷地图