中小上市企业信用分类的应用研究
——基于BP神经网络与SVM的分类方法

2020-03-25 11:39峰,
关键词:企业信用正确率类别

石 峰, 胡 燕

(1.湖南工程学院 管理学院,湖南 湘潭 411104;2.中南大学 法学院,湖南 长沙 410012)

中小企业数量多、分布广,是我国现代国民经济的重要组成部分。2018年国务院促进中小企业发展工作会议指出:我国中小企业具有“五六七八九”的典型特征,贡献了50%以上的税收,60%以上的GDP,70%以上的技术创新,80%以上的城镇劳动就业,90%以上的企业数量,是推动经济实现高质量发展的重要基础。因此,支持中小企业发展可以为我国高质量发展提供强大而持久动力。当前,我国中小企业直接融资比例严重不足。信用是融资的前提条件,企业信用评级是中小企业获得政府扶持的重要保证。

关于中小企业的信用研究,主要围绕信用评价指标体系构建、信用违约影响因素、信用风险评估、信用评价方法等方面。

范柏乃、朱文斌从偿债能力、经营能力、创利能力、管理能力和创新能力等六个方面构建了28个评价指标体系。[1]李梅、马国建根据不同行业中小企业的特点,构建了中小企业信用综合评价指标体系。[2]Kuwahara构建了中小企业财务评价指标体系,并试图构建日本金融机构提供给中小企业信用贷款的财务数据库。[3]何光辉基于国有商业银行数据实证检验发现,小微企业信用违约受到贷款金额、信用等级、进出口贸易、贷款期限与利率等因素的影响。[4]朱宗元等运用Lasso-logistic模型对新三板企业进行信用风险评估。[5]孙浩基于交叉DEA-Tobit模型对中小企业进行信用风险评价。[6]Zhu,Hai采用基于组合加权法和线性加权法构建中小企业信用评价指标体系,并对24家企业进行信用风险评估。[7]佚名运用模糊聚类分析与SOM-K算法对小微企业信用进行评估。[8]Jones基于神经网络和支持向量机的非线性判别对企业信用评级指标分类。[9]Corazza运用多标准决策分析法(MCDA)对意大利中小企业的偿债能力评级指标进行筛选。[10]

以往研究主要针对大中型企业构建信用评价指标体系,并运用不同评价方法进行信用评估。本文以中小板企业财务数据,运用BP神经网络与SVM(支持向量机)两种方法,对中小上市企业的信用进行预测分类。从而探讨BP神经网络与SVM方法在中小上市企业信用分类的应用。

一 数据与指标评价体系

本文所选数据来源于Choice数据金融平台的中小企业板数据,其中,深交所股票市场类ST中小企业总共有28家;在深交所全部A股中随机选取28家非ST中小企业。为有效区分中小上市企业信用的类别,构建基于偿债能力、营运能力、盈利能力、成长能力和现金流量指标的信用评价体系(见表一)。

本文从56家中小上市企业中选取46家企业作为训练样本,其中,23家企业为ST上市企业;23家企业为非ST上市企业,训练样本数据见表二所示。

表一 中小上市企业信用评价指标体系

表二 中小上市企业信用分类训练样本数据

续表二

同时,本文从选取的56家中小上市企业中的剩余10家企业作为测试数据样本。在这10家企业中,有5家ST上市企业和5家非ST上市企业。测试样本数据见表三所示。

表三 中小上市企业信用分类测试样本数据

二 基于BP神经网络法的中小上市企业的信用分类

(一)BP神经网络的计算过程

BP神经网络采用梯度下降法,并按照误差反向传播机制训练多层次的前馈网络,在使用梯度搜索技术的过程中,使得网络的实际输出值与期望输出值的误差均方差达到最小。

本文的BP神经网络计算过程分为以下步骤:(1)数据的输入,输入数据矩阵和目标数据矩阵;(2)对输入数据矩阵和目标矩阵的数据归一化处理;(3)网络训练,建立网络模型,初始化网络结构,采用梯度下降法训练。其中,学习速度为0.05,最大训练轮回为10 000次,均方误差为0.000 5,1 000轮回显示一次结果;(4)对训练数据进行仿真,利用46家中小上市企业的原始数据进行BP神经网络仿真;(5)对测试数据进行仿真,利用10家中小企业的样本测试数据进行仿真测试;(6)网络预测输出和结果分析,根据网络预测输出找出数据类别,并进行结果分析以及判定预测正确率。

(二)BP神经网络信用分类的结果分析

图1 中小上市企业信用分类图(BP神经网络分类)

从图1的预测分类与实际类别看出,10家测试样本只有3家测试正确,其中第3、6、8企业的信用分类为ST企业,预测分类也为ST企业;第1企业的实际类别为ST企业,但预测类别为非ST企业;第2企业的实际类别为非ST企业,但预测类别为ST企业;第4企业的实际类别为非ST企业,但预测类别为ST企业;第5企业的实际类别为非ST企业,但预测类别为ST企业;第7企业的实际类别为非ST企业,但预测类别为ST企业;第9和10企业实际为ST企业,但都预测为非ST企业。可见,预测正确率只有30%,预测效果不理想。

图2 BP神经网络训练结果

从图2的网络训练结果曲线也能看出,网络训练所得均方误差不能满足目标要求。由此可见,采用BP神经网络技术的方法对上述56家中小上市企业进行信用分类不适合。

三 基于SVM法的中小上市企业的信用分类

支持向量机(Support Vector Machine, SVM)是一种由分离超平面正式定义的判别分类器。换句话说,给定标记的训练数据(监督学习),以迭代方式输出最佳超平面,可用于分类或回归问题。在二维空间中,这个超平面是将平面分成两部分,其中每一部分都位于两侧,以分割不同的类。简而言之,SVM的核心思想就是找到最佳超平面,将数据集分离并归类。

对于线性分类问题,本文选取线性核函数,原始数据包括训练数据和测试数据两部分。在中小上市企业信用分类的两组原始数据中,每组前23个用于训练;每组后5个用于测试。我们首先选取原始数据的前两个属性值(X1和X2)进行分类,这样便于将训练样本与测试样本集中反映在二维坐标平面图形中(见图3、图4)。

图3 SVM分类结果图

图4 中小上市企业信用分类图(两个属性值的SVM分类)

从图3和图4的分类结果看出,5家ST企业中,有4家ST企业预测分类正确;第2家企业为ST企业,但预测结果为非ST企业。在5家非ST企业中,有2家企业预测分类正确,其中,第8和第10企业为非ST企业,但预测结果为ST企业。总的来看,在10家中小上市企业测试样本中,有6家测试正确,预测正确率为60%。

本文随后选取原始数据的全部属性值(X1、X2、X3、X4、X5、X6、X7、X8)进行分类。将全部属性值与两个属性值分别进行分类,前者预测分类结果的正确率会更高。基于全部属性值的中小上市企业信用分类结果显示(见图5),5家ST企业有3家预测分类正确,其中第1家和第2家为ST企业,但预测结果为非ST企业;5家非ST企业有4家预测分类正确,第9家企业为非ST企业,但预测结果为ST企业。由此看出,在10家中小上市企业测试样本中,有7家测试正确,预测正确率为70%。

图5 中小上市企业信用分类图(全部属性值的SVM分类)

四 BP神经网络与SVM分类结果比较

基于全部属性值的中小上市企业信用分类结果也不是令人满意,但与BP神经网络分类相比较而言,预测正确率大大增加。作为中小上市企业信用分类的两种方法,从模型的预测正确率看,SVM通过求解凸二次规划问题得到预测分类结果,能得到全局最优解,具有比BP神经网络更高的预测精度。从两种分类方法的泛化能力看,SVM能够有效避免过度拟合的问题。BP神经网络采用梯度下降法,计算速度慢,有可能进入局部最小值而导致训练失败。SVM利用核函数代替了高维空间的映射,最大化间隔是核心,支持向量是训练的结果,可以提出较大的样本,具有较小的鲁棒性。但SVM难以实施大规模训练,不能有效解决多分类问题。同时,SVM实际应用过程中主要依赖于核函数的选择,具有较大主观性。

本文运用BP神经网络与SVM两种分类方法对中小上市企业进行信用分类,无论是BP神经网络法,还是SVM法,基于现有的56个样本企业数据的信用分类,预测正确率都没有达到预期效果。但SVM法的预测分类正确率远远高于BP神经网络的预测分类正确率。

五 结 语

本文选取Choice数据金融平台的中小企业板数据,运用BP神经网络与SVM方法对中小上市企业进行信用分类,研究结果表明:SVM法的预测分类正确率远远高于BP神经网络的预测分类正确率。两种分类方法虽然没有达到理想的预测分类效果,但在中小上市企业信用分类的应用研究中,未尝不是一种方法的选择。后续的研究将考虑运用粒子群优化聚类算法、粒子群模糊神经网络等方法对中小上市企业进行信用分类,以提高预测精度。

猜你喜欢
企业信用正确率类别
扬州市稳步推进安全生产领域企业信用修复
泰州市推行企业信用修复全链条服务模式
个性化护理干预对提高住院患者留取痰标本正确率的影响
论陶瓷刻划花艺术类别与特征
门诊分诊服务态度与正确率对护患关系的影响
一起去图书馆吧
能源局试点承装修试电力设施企业信用监管
影响企业信用政策制定的因素分析
生意
生意