潘旭洁 虞珂 张灵玉
【摘 要】本文针对银行对中小微企业的信贷策略,使用K均值聚类、BP神经网络等方法,分别构建企业分类模型、贷款额度模型等,使用Python、Matlab、Excel等软件求解,得到在总贷款额度和贷款额度范围固定的条件下,具体企业贷款方案、风险最低的企業相关信息和贷款额度。首先对数据进行处理,筛选出发票平均金额、信誉评级、有效发票率这三个指标,再计算贷款额度及年利率,分别使用了K均值、熵值法、直线方程等方法,构建企业分类模型和贷款额度确定模型。使用Python、Matlab软件编程,将信誉评级非D的99家企业聚成4类,对每类企业得到具体贷款方案,其中,在总贷款额度W大于1亿元的情况下,风险最低的企业代号为E1的贷款额度为元,年利率为。
【关键词】中小微企业;信贷策略;K均值聚类;BP神经网络;Python
分类号:F276.3;F275;F274
一、问题重述
1问题背景
随着中国经济的发展,银行的借贷能力日益提高;而中小微企业作为市场经济的重要组成部分,却面临融资难的问题。由于规模相对较小、缺少抵押资产等原因,中小微企业在融资市场始终处于弱势地位;对此,银行推出小微业务,即依据信贷政策、企业的交易票据信息和上下游企业的影响力等因素,向实力强、供求关系稳定的企业提供贷款,并对信誉高、信贷风险小的企业给予利率优惠。
早在2005年,长期着眼于开发性金融实践的国家开发银行启动“微小企业贷款项目”,牵头引进德国国际项目咨询公司(即“IPC公司”)的专家团队和微贷技术服务,并与世界银行、德国复兴信贷银行建立长期合作关系。南开大学的吴英晶学者于2014年提出基于供应链关系的中小企业融资决策研究,运用金融学、运筹学、经济学和库存理论等相关理论和方法,研究了中小企业融资额和融资成本问题[1]。王海润教授在2019年构建数据化决策,以应对中小微企业借贷所面临的挑战[2]。
2问题描述
对附件中的123家企业的信贷风险进行量化分析,给出该银行在年度信贷总额固定时对这些企业的信贷策略。解题思路:对信誉评价为ABC的企业都给予放贷,首先将信誉评级为D的企业剔除;再以每个企业的有效发票的平均金额作为衡量企业实力大小的依据,以每个企业的信誉评级和有效发票与作废发票之比作为风险等级的依据;然后将这三个指标用k均值进行聚类,得出信贷风险等级;再根据直线方程算出问题一中信贷额度和年利率的大小;最后得出信贷决策,分别为是否放贷、放贷额度、年利率。
二、基本假设
(1)假设企业信誉等级可量化并且银行信贷额度足够;
(2)假设以一年度为研究期限,数据单位统一为“元”;
(3)假设信贷市场不存在信息不对称情况;
(4)假设经过剔除后的统计数据真实可信;
(5)假设附件2中的企业完全遵守附件3中客户流失率的规律;
(6)假设客户流失率就是企业流失率;
(7)假设突发因素不会改变企业的信誉评级,只影响企业聚类中心。
三、问题
1问题分析
对123家企业的信贷风险进行量化分析,理论上风险越小,信誉评级越高,实力越大,年利率就越小,贷款额度就越大。可以利用k均值算法进行聚类,算出风险等级。利用直线方程来限定贷款和年利率的范围,最后给出该银行在年度信贷总额固定时对这些企业的信贷策略。
总思路:首先进行企业分类,每个类别企业有相同的贷款策略,将企业各指标利用熵值法确定风险得分,然后将风险得分带入直线方程确定贷款额度。
2对问题的求解
2.1模型准备
对数据进行预处理,具体:首先将信用评级为D的企业剔除,一共有24企业;再将数值为负数的金额转换为正值;以每个企业的进项和出项的发票平均额的总和作为衡量企业实力大小的依据,以每个企业的信誉评级和有效发票占总发票数之比作为风险等级的依据。
并将企业的信誉等级A、B、C分别赋值为为3、2、1,利用软件处理数据,筛选出的99家企业的指标值统计如下表(详细数据见附表1):
2.2模型建立
模型Ⅰ 企业聚类模型
通过模型准备,一共筛选出99家企业,数目较大,于是通过K均值聚类将这99 家企业进行聚类,以更好的观察及求解。
初始化方法:从数据集中随机选择个观测值作为初始均值。首先为每个观测值随机分配一个聚类,然后进入更新步骤,从而计算初始均值作为聚类的随机分配点的质心。
根据以上步骤选出个均值的初始集合后,该算法将在以下两个步骤之间交替进行:
①分配步骤:计算最小二乘欧式距离,将每个观测值分配给具有最接近均值的聚类
②更新步骤:重新计算分配给每个聚类的观测值的均值。
当分配不再更改时,该算法已收敛,至此已聚类完成。
模型Ⅱ 贷款额度模型
确定风险得分[4]
①为消除各指标在数量级和量纲上的差异,将各指标数据归一化处理。
②用归一化后的指标值,计算信息熵:
③加权和法计算风险得分:
式(2)中,为风险得分。
确定贷款额度
从直线方程受到启发,利用规定企业贷款额度在合理的范围内
式(3)中,为实际信贷总额,为第个企业的贷款总额度,贷款系数,为最小信贷额度,为最大信贷额度。
年利率的确定方法类似
2.3模型求解
Step1:企业聚类结果:利用软件求解,得出各企业的聚类中心,聚类结果可分为四类,序号分别为0、1、2、3,其中,企业代号为E1企业聚成一类,企业代号为E4和E12的企业聚成一类,企业信贷风险详细数据见附表2。
Step2:计算出贷款额度与贷款年利率,由此给出聚类中心及企业的贷款方案,信誉评级为D的企业不考虑贷款,其余企业皆可贷款。
2.4结果分析
得分越高,说明风险越低,最优方案由所有最优加权属性值构成,聚类中心序号为1的即企业代号为E1这家企业风险最低,可予以贷款,贷款额度为0.1737W-1619423.3570,年利率为1.9297×10-7W-1.9105,E4和E12的风险仅次于E1,而聚类中心序号为2即企业代号为E2、E3、E7等多家家企业得分最低,风险较高,但也可予以贷款;信誉评级为D的企业不考虑贷款。
四、模型的推广
1信贷风险评估模型
我们所研究的风险评估是将进行预处理后的数据代入构建的评价体系,再通过软件筛选、匹配相应的数据信息;我们还可以将信贷风险评估模型延伸到其他领域,比如水资源短缺风险评估、房地产项目风险评估等;
2企业分类模型
我们将筛选出的99家企业进行数据预处理,通过k均值聚类进行聚类均值循环,最终将企业分类;此模型用于生活中常见的分类问题,比如金融产品的分类、互联网加时代电商企业的分类;
3贷款额度确定模型
为了更加科学地制定信贷决策方案,我们查阅文献,最终决定将贷款额度作为信贷决策方案的重要部分,并通过具体公式计算相应贷款额度,这是一个比较有说服力的模型方法,具有推广意义。
参考文献:
[1]吴英晶.基于供应链关系的中小企业融资决策研究[D].南开大学,2014.
[2]王海润,赵西满,冯威.构建数据化决策化解中小微企业融资难[J].现代商业,2019(22):143-147.
* 本文属安徽财经大学科研基金项目《BP神经网络下基于K均值聚类的中小微企业信贷策略研究》(编号:XSKY21109)阶段性研究成果,指导老师:张多蕾。
作者简介:潘旭洁(2000——)女,汉族,安徽马鞍山人,安徽财经大学会计学院,2018级本科生,会计专业
2753500783265