基于GM(1,1)-神经网络模型的安徽省财政收入预测

2022-07-07 07:06刘茂茹王丰效
高师理科学刊 2022年6期
关键词:统计局财政收入灰色

刘茂茹,王丰效

基于GM(1,1)-神经网络模型的安徽省财政收入预测

刘茂茹,王丰效

(喀什大学 数学与统计学院,新疆 喀什 844000)

财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况,而地方财政是国家财政的重要组成部分,对财政收入进行合理的预测能够有效了解地方经济发展状况.关于地方财政收入及其影响因素,文献[1-4]讨论了影响因素在时间或空间上改变时地方财政的变化情况,并提出地方财政收入结构优化的建设性思路,探求合理的收入制度.自邓聚龙教授提出灰色系统理论以来,灰色预测模型及其改进模型在经济领域得到了广泛应用,主要因其能够在数据量少、信息贫的情况下进行较为准确的预测,对灰色预测模型的改进和应用已被众多学者所关注[5-7].神经网络模型预测方法被广泛应用于众多领域[8-11],将灰色预测模型与神经网络预测模型进行组合预测能够得到较为准确的预测结果,众多学者对于此组合预测模型也有着相应的研究[12-14].

1 数据选取与处理

1.1 数据选取

相关数据来源于安徽省统计年鉴[15-24].

2010—2019年安徽省财政收入及其影响因素的相关数据见表1.

表1 2010—2019年安徽省财政收入及其影响因素的相关数据

1.2 数据质量分析

数据质量分析是数据探索的前提,不可信的数据是无法得出可信的结论的.数据质量分析是以评估数据的正确性和有效性为目标,本文通过Python软件对收集到的数据进行一系列数据质量分析,从而判断用来预测安徽省财政收入的各影响因素是否有效.

1.2.1 缺失值分析 判断变量中是否含有缺失值,无论是数据中记录的缺失还是某个字段信息的缺失,都会影响分析结果的准确性.经Python代码运行,发现安徽省影响财政收入的数据变量中不含有缺失值.

图1 有异常值的箱线图

图2 修正过后的箱线图

1.2.3 重复数据分析 重复性数据分析也是数据质量分析的一个关键要素,通过判断安徽省财政收入影响因素中变量之间是否有重复性数据,来判别数据质量是否影响预测.经Python代码分析,发现数据中并无重复性数据,符合数据质量要求.

1.3 数据特征分析

把握数据整体的性质对于数据分析是否成功来说是至关重要的.使用统计量来检查数据特征,主要是检查数据的集中程度、离散程度和分布形状,通过这些统计量可以识别数据集整体上的一些重要性质,对后续的数据分析,有较大的参考作用.本文采用描述性统计分析和相关性分析了解数据的结构与性质.

1.3.1 描述性统计分析 对数据进行描述性统计分析,结果见表2.

表2 描述性统计分析结果

图3 热力图

2 模型构建

2.1 Lasso回归法

Lasso回归法的基本思想是在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化,从而能够产生某些严格等于0的回归系数,得到可以解释的模型,其数学表达式为

2.2 灰色模型—神经网络模型组合预测

设原始数列为

经1-AGO后可得到

紧邻均值生成为

最终得到灰色预测模型为

将经过Lasso特征选择之后的变量代入编译好的灰色预测模型中进行预测,预测出2020—2021年各影响因素的值(见表3).

表3 2020—2021年各影响因素灰色模型预测结果

为了了解模型是否通过检验,预测后采用后验差检验法判断模型精度.经Python代码运行,得到各影响因素的模型精度都为“一级(好)”,即模型通过检验.

2.2.2 神经网络预测模型 神经网络结构包含输入层、隐藏层(可以有多层)和输出层.每一层当中包含很多存储数据的节点,称之为神经元,每一个神经元都与下一层所有神经元连接,每一对连接都有对应的一个参数.这种连接维持了神经元之间信息的传递,信息的传递其实就是一个数学计算过程.前向传播过程输入信息由输入层→隐藏层→输出层,后向传播过程更新信息由输出层→隐藏层→输入层.预测时,输入原始数据信息到输入层,经过中间层的数学计算,得到输出,即财政收入;训练时,先进行前向传输预测得到财政收入输出,然后根据输出与实际的差距,进行后向传播,这个过程会调整网络之中的参数,从而使得下一次预测更为准确.

表4 2010—2021年安徽省财政收入神经网络预测

由表4可以看出,已知的实际值与经过预测后得到的预测值相差较小,可认为模型拟合程度较好,经过灰色模型-神经网络模型组合预测得到2020年安徽省财政收入为64 480 128万元,2021年安徽省财政收入为70 866 816万元.

3 结语

[1] 刘明慧,党立斌.地方财政收入的合意性:基于结构视角的分析[J].宏观经济研究,2014(8):10-20.

[2] 王克强,胡海生,刘红梅.中国地方土地财政收入增长影响因素实证研究:基于1995—2008年中国省际面板数据的分析[J].财经研究,2012,38(4):112-122.

[3] 尚元君,殷瑞锋.对地方政府财政收入能力影响因素的实证分析[J].中央财经大学学报,2009(5):12-15,42.

[4] 苏永军.中国地方政府收入行为与地方收入制度优化研究[D].上海:复旦大学,2006.

[5] 王丰效.修正GM(1,1)模型在销售量预测中的应用[J].渭南师范学院学报,2003(5):10-11,58.

[6] 杨华龙,刘金霞,郑斌.灰色预测GM(1,1)模型的改进及应用[J].数学的实践与认识,2011,41(23):39-46.

[7] 卢懿.灰色预测模型的研究及其应用[D].杭州:浙江理工大学,2014.

[8] 徐黎明,王清,陈剑平,等.基于BP神经网络的泥石流平均流速预测[J].吉林大学学报(地球科学版),2013,43(1):186-191.

[9] 范中洲,赵羿,周宁,等.基于灰色BP神经网络组合模型的水上交通事故数预测[J].安全与环境学报,2020,20(3):857-861.

[10] 姚兰,戎荷婷,褚超,等.基于人工神经网络的工业供应链销售预测方法[J].计算机与数字工程,2021,49(10):2057-2061,2144.

[11] 顾军华,宋丽娟,宋洁,等.基于改进BP神经网络的税收收入预测模型[J].河北工业大学学报,2003(1):39-43.

[12] 王丰效.组合预测模型预测精度的贴近度评价法[J].统计与决策,2013(8):70-72.

[13] 王丰效.GM(1,1)组合预测模型及其应用[J].统计与决策,2006(21):142-143.

[14] 陈淑燕,王炜.交通量的灰色神经网络预测方法[J].东南大学学报(自然科学版),2004(4):541-544.

[15] 安徽省统计局.2011[M].北京:中国统计出版社,2011.

[16] 安徽省统计局.2012[M].北京:中国统计出版社,2012.

[17] 安徽省统计局.2013[M].北京:中国统计出版社,2013.

[18] 安徽省统计局.2014[M].北京:中国统计出版社,2014.

[19] 安徽省统计局.2015[M].北京:中国统计出版社,2015.

[20] 安徽省统计局.2016[M].北京:中国统计出版社,2016.

[21] 安徽省统计局.2017[M].北京:中国统计出版社,2017.

[22] 安徽省统计局.2018[M].北京:中国统计出版社,2018.

[23] 安徽省统计局.2019[M].北京:中国统计出版社,2019.

[24] 安徽省统计局.2020[M].北京:中国统计出版社,2020.

LIU Maoru,WANG Fengxiao

(School of Mathematics and Statistics,Kashi University,Kashi 844000,China)

A

10.3969/j.issn.1007-9831.2022.06.004

1007-9831(2022)06-0017-06

2021-12-13

国家社会科学基金项目(11XTJ001)

刘茂茹(1998-),女,安徽合肥人,在读硕士研究生,从事金融统计与风险管理研究.E-mail:411695188@qq.com

王丰效(1965-),男,陕西礼泉人,教授,从事应用概率统计研究.E-mail:fxw-hz@126.com

猜你喜欢
统计局财政收入灰色
一季度全国财政收入恢复性增长
浅灰色的小猪
我国财政收入运行持续向好一季度税收同比增长17.3%
欧盟统计局数据确认加速从中国进口电动自行车
中国财政收入走势图
灰色时代
她、它的灰色时髦观
各地GDP增速大排行
感觉
上半年财政收入总值14306.78亿元