基于大数据背景下南宁市经济发展中的产业分析

2018-09-10 07:22杨程韦武杰黄智宁冯硕苏强
企业科技与发展 2018年3期
关键词:多元回归经济发展大数据

杨程 韦武杰 黄智宁 冯硕 苏强

【摘 要】文章针对传统经济分析方法在分析当前国内宏观经济领域方面的不足,提出在宏观经济分析中,尤其在经济产业分析中可以借助大数据技术进行分析。同时,探讨了使用大数据进行经济分析的目的和意义,并利用大数据技术对经济发展中的产业进行分析,总结出三次产业近年来的发展变化规律,找出对总体经济产生较大影响的产业。

【关键词】大数据;经济发展;产业分析;多元回归;季节性交乘趋向

【中图分类号】F121.3 【文献标识码】A 【文章编号】1674-0688(2018)03-0001-05

0 引言

经济运行与发展是一个抽象的过程,其变化与结果都不能为人们所直接接触到,而主要通过一系列的经济指标反映出来,使我们对宏观经济的分析成为可能。宏观经济分析(总量分析)和微观经济分析(个量分析)通常被认为是经济学中的数量分析[1-3]。

然而,传统的经济分析往往通过建立时间序列、截面或面板方程等几个模型来进行,其变量被认为不够完整[4]。由于模型变量选择、参数设置、估计方法及滞后期选择等的不同,预期结果往往滞后,通过计量经济进行统计分析的手段较为单一,不足以准确地呈现经济发展的本质,导致预测结果会产生很大的偏差[4]。

随着跨境电商、电子口岸、网上购物、社交网络等新兴市场、经济与贸易方式的飞速发展,电子商务、互联网金融等商业模式和方式已经成为人们生产生活不可或缺的重要形式。各种行为所产生的数据量越来越大。大数据时代的到来,不仅意味着数据处理技术和处理能力的极大提升,而且使得全社会的数据资源分布结构也在发生深刻改变。此外,在实时、交互、离散化、非结构化的海量数据中,蕴含着经济社会运行和经济发展的各种先行指标信号。基于大数据的宏观经济监测和预测将变得越来越重要。

當前,在宏观经济分析中如何充分利用大数据方法和技术已经开始在国际上引起重视[5-11],从国内的情况来看,将大数据与宏观经济联系起来的研究还鲜有见到,宏观经济政策制定者对此也重视不够,而这正是本次研究的目的和意义所在。

1 大数据概念

大数据,是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。它不仅指数据本身的规模,而且包括采集数据的工具、平台和数据分析系统。一般认为,目前大数据的典型特点可以用“5V”即大量化(Volume)、快速化(Velocity)、多样化(Variety)、价值化(Value)和真实性(Veracity)来概括[12]。

社交媒介、移动设备、网上交易和网络设备更新的速度非常快,构成大数据的信息类型来源不同,包括网络日志、音频、视频、图片、地理位置信息等。其中,大概只有10%属于结构化数据适合整齐地进入相关数据库的行和列,其余90%是非结构化数据。大量数据的价值密度低呈现碎片化,价值密度的高低与数据总量大小呈反比。如何通过强大的机器算法更迅速地完成数据的价值“提纯”变得十分重要,也是数据挖掘的关键。

2 大数据在宏观经济分析中的意义

2.1 研究目的

利用大数据方法和技术对经济发展中的产业进行分析,通过对三次产业近年来的发展变化规律,研究找出对总体经济产生较大影响的产业,从而找准经济发展中的薄弱点或关键点。本文以南宁市经济发展为研究对象。

2.2 大数据对宏观经济分析的意义

就宏观经济分析而言,大数据时代带来的转变是重大且具有革命意义的。

2.2.1 大数据拓宽了经济信息来源

互联网时代打造了碎片化、泛在化的信息环境,而通过物联网、移动互联网、大数据等技术手段对各类异构数据进行收集,极大地扩充了数据的范围和领域,提供了全量信息的分析前提。大数据时代,得到的数据可能就是总体本身。例如,每条电子在线交易记录等。

大而全的可得数据对宏观经济分析是极其重要的,可以帮助人们准确了解宏观经济形势,正确做出宏观经济发展预测,合理制定宏观经济政策。

2.2.2 经济信息获得的速度大大提高

信息可以实时得到。信息产生和传递的速度空前加快,如互联网信息是在线即时的,移动互联网和物联网使每个人都可能随时随地地制造数据。大数据经济模型可以充分利用数据的实时性,提高分析或预测的时效性,为经济预警和政策制定提供最快速的资料和依据。

2.2.3 方法论变革

随着信息量的极大拓展和处理信息能力的极大提高,经济分析可能从样本统计时代走向总体普查时代。这无疑将会极大地提高宏观经济分析的准确性和可信度。大数据分析则往往将相关性发掘作为首要任务,更重视可靠相关关系的发掘,充分利用相关关系对于经济预测、政策制定与评估的作用,将建立在相关关系分析基础上的预测作为大数据时代经济发展的核心。

2.2.4 促进了整体经济分析技术的革新

大数据中的大量信息是非结构化的,数据的来源和形式复杂多样,如互联网信息包含文本、图片、影音等多种形式,在此状况下必须借鉴计算机领域已经出现但在现有经济领域还少有应用的数据处理技术(例如机器学习、深度学习等技术)进行分析。机器学习已经在图像识别、语音识别、自然语言处理、智能机器人等领域取得了巨大成功,是当前进行大数据分析的基本手段。此类技术在宏观经济领域的应用会极大地提高经济分析的能力,改进分析结果、提升分析价值。

3 基于大数据背景下经济发展中的产业分析

3.1 大数据应用思路

面对涉及国民经济及宏观与微观等各个领域不同层面的泛在化网络、异构化数据,通过大数据分析机制,制定分析方法和步骤,按照科学严谨的做法,有条不紊地将各项任务梳理好,得出精准的结果。

大数据分析的过程如图1所示。

大数据分析整体可以分为数据采集、数据传输与存储、数据分析与挖掘、数据应用4个环节。

3.1.1 数据采集

数据采集系统主要面向互联网、统计局公布等各类数据源进行数据的采集和汇总,实现经济、产业、企业、社会活动等领域的信息收集,形成数据仓库,为分析行为提供必要基础素材。数据采集技术架构如图2所示。

通过调研和走访及专家论证等形式,确定了互联网数据的采集范围。通过采集统计局官网公布的统计数据等互联网数据。共计156项指标。

在确保数据信息安全的基础上,按照既定的数据目录,按周定时采集的方式,已经陆续采集了6周的数据,包括证券交易所、智联招聘、大众点评、淘宝网、中国东盟大宗商品交易所、如家酒店、12306、中国国航及百度糯米等网站的数据。共计181项指标。

3.1.2 数据传输与存储

数据传输与存储主要包含数据传输、数据清洗、数据存储等过程,对采集到的各类异构数据的传输、清洗、转换、入库等操作处理,实现数据组织与存储管理,实现社会经济大数据体系的统一管理与服务。

3.1.3 数据分析与挖掘

根据社会经济发展趋势分析的要求,通过统计分析、数据挖掘、机器学习、深度学习等各类算法,对各类经济和市场数据进行分析和规律的挖掘。找出关键事件、关键指标,并找出相互之间的关联关系,建立预测模型对经济发展的未来提供辅助决策支持。

3.1.4 数据应用及展示

主要面向各类应用领域,提供决策建议。将数据分析的结果以可视化图表、动态图等形式展示。

3.2 产业分析

研究分析的依据主要为“推动力”,具体指某个产业或行业对经济增长的贡献率与其占经济总量的比重。例如,第二产业占国民经济的比重为40%,但其占经济增量的比重仅为20%。我们认为第二产业的推动力为50%,也就是说第二产业仅产生了其本身50%的效能。当推动力为100%时,认为该产业发挥了100%的效能,对经济发展做出了应有的贡献。计算公式如下:

某产业推动力=(该产业增加值增量/总增量)/(该产业上年度增加值总量/上年GDP总量)×100%。

3.2.1 大数据三次产业总体发展趋势分析

3.2.1.1 产业推动力分析

通过研究计算南宁2011—2016年第二季度的三次产业的产业推动力,其变化趋势如图3所示。

结果说明如下。

(1)2016年1季度GDP增速大幅下降,主要是由于第二产业增加值的大幅下降引起的。1季度总体增加值较2015年同期增长35.9亿元,该增量较2015年同期减少9.5亿元,其中第二产业增加值较2015年同期下降了3.8亿元,该增量较2015年同期减少了21.4亿元。这从第二产业的推动力可以看出,2016年1季度第二产业的推动力为-27.3%。也就是说,第二产业不仅没能贡献其40%的增量,而且还拖累了总体经济。

(2)2015年以来,第二产业对经济的推动力出現下降。第二产业推动力由2014年的114%下降至2015年的90.5%,再次下降至2016年的27.3%。表明近2年南宁市工业运行较为疲软,呈下行态势。

(3)第三产业的推动力呈上升态势。第三产业推动力由2013年的85.6%,逐步上升至2016年的155%。表明近年来南宁市第三产业发展较为稳定,成为经济继续增长的主要推动力。

(4)第一产业推动力整体平稳,近2年有所上升。第一产业推动力一直处于100%以下,表明农业发展的效能不高,但2015—2016年,受工业推动力下降影响,农业的推动力相对上升。

三次产业推动力的年度变化趋势如图4所示。

从图4可以看出,近年来南宁市经济增速放缓,主要是受工业发展呈下行态势影响。为此,经济发展要稳定,首先工业发展要稳定。在未来一段时期内,政府要密切关注工业发展态势。

3.2.1.2 通过工业产值预测GDP增速

通过数据分析,可以首先预测工业总产值,然后找出工业产值与GDP增速之间的关系,进而预测GDP增速。

为此,需要做以下2项工作:?譹?訛预测工业总产值;?譺?訛找出工业总产值与GDP增速的关系。

对工业总产值(月度)进行预测时,我们采用季节性交乘趋向模型,得到的模型为y=(288 020-8 601.4×T)×Si,其中Si(i=1,2,…,12)为月度季节性指数。模型的拟合优度为95%。通过计算可得预测平均误差为6.4%,其中2016年预测误差为8.0%。

以GDP增速为因变量,以第二、三产业的增加值增速为自变量,对GDP增速进行多元回归,可得到GDP增速与三次产业增速的线性关系。在基于工业产值对GDP增速进行预测时,需设定第三产业的增速保持2015年同期水平即可。

多元回归的结果为y=15.8X2+18.8X3-29.6,其中y表示GDP增速,X2为工业增加值增速,X3为第三产业增加值增速。对南宁2015—2016年的GDP预测结果如图5所示。

2015—2016年2季度,该模型预测的平均误差为6%。且最大误差为11.1%(2016年1季度)。说明该模型预测误差低,且非常稳定。

该模型预测2016年3季度GDP增速为7.3%。

3.2.2 工业运行分析

3.2.2.1 从轻、重工业角度分析

2015年,南宁市轻、重工业占工业总产值的比重分别为45%和55%。通过对轻、重工业的推动力变化趋势的分析,可以得到的结论如图6所示。

(1)2016年1季度工业总产值的迅速下滑,是由轻工业产值的迅速下滑引起。1季度轻工业产值较2015年同期下降8亿元,重工业增加2.6亿元,拉动工业总产值下降5.4亿元。这从一季度轻工业的负向推动力(-200%)可以看出,且从2015年4季度开始,轻工业就已经出现明显下滑。

(2)近年来,南宁市轻工业疲软,对工业发展的推动力逐步降低,也拖累了工业的整体发展。轻工业对工业发展的推动力由2011年100%逐步下降至2016年的-66.3%(负向推动)。因此,下一步应着重研究轻工业变化的原因。

(3)重工业整体发展稳定,成为推动工业发展的中坚力量。因此,从数据角度来看,保持重工业的稳定发展是保持工业发展的关键。

南宁轻、重工业推动力的年度变化趋势如图7所示。

3.2.2.2 从工业企业类型角度分析

从工业企业类型来看,南宁市工业发展中股份制企业、外商及港澳台企业和国有企业产值占比分别为66%、20%和12%。股份制企业占比最大,其发展状况关乎整体工业状况。主要类型工业企业产值分布如图8所示。

我们通过观察3种主要类型企业的推动力变化趋势,得到以下结论。

(1)2016年第1季度工业总产值下降是受股份制企业和外商及港澳台企业产值大幅下降影响。第一季度,股份制企业产值同比减少12.3亿元,外商及港澳台企业产值同比减少4亿元,而国有企业产值同比增加10.6亿元。这从图9中这3类企业推动力的强烈反差可以看出。

(2)2015年以来,股份所有制企业对工业发展的推动力减弱,从2014年的正向推动,转变为2015—2016年的负向推动。由于股份制企业占工业产值的2/3,因此要保证工业健康发展,就要稳定股份制企业发展形势。3种类型企业对工业发展推动力年度变化趋势如图10所示。

通过从轻、重工业和不同类型工业企业的发展态势来看,轻工业和股份制企业的运行出现下行态势,因此要把握工业发展状况,就必须关注轻工业中的股份制企业的发展状况。因此下一步进行经济观测时,重点关注轻工业中的股份制企业的运行动态。

3.2.3 第三产业运行情况分析

南宁市第三产业中,产值较大的行业分别为金融保险业、批发零售业、房地产业和交通运输业,这4个行业贡献了第三产业近六成的产值。南宁市第三产业主要行业构成如图11所示。南宁市第三产业主要行业各年度推动力趋势如图12所示。南宁市第三产业主要行业各季度推动力趋势如图13所示。

从第三产业4个主要行业2011—2015年推动力变化趋势来看:

(1)近年来金融保险行业保持了较好的发展态势,成为第三产业主要的推动力量。

(2)房地产业的推动力呈下降趋势,对第三产业贡献率不断下降。房地产2015年产值155.7亿元,增长4.9亿元,增幅收窄了七成。去库存压力较大。

4 產业分析结论

通过利用大数据对南宁市经济发展中产业的分析,得出如下结论。

4.1 经济运行主要问题

(1)工业疲软,尤其是轻工业和股份企业下行态势明显。重点分析研究的领域侧重到与工业相关的指标。

(2)第三产业中,金融保险业发展平稳,房地产业增速明显放缓,去库存压力大。

4.2 GDP增速预测方法

预测月度工业增加值(季节性交乘模型)后,再预测GDP增速(多元回归)。预测平均误差为6%,且稳定性较好。

4.3 对特定性指标找寻的启发

在经济运行中波动较大或出现较大幅度变化的行业范围内,搜集更多指标。例如,在轻工业(尤其股份制企业)、房地产业等行业搜集相关指标,并在该范围内进行敏感指标的筛选,有助于更加准确地找到及时反映经济运行状况的指标。

参 考 文 献

[1]葛莹,姚士谋,蒲英霞.试论城市体系的微观经济分析

[J].南京社会科学,2005(3):40-46.

[2]郭树清.中国宏观经济分析基础[J].金融研究,2005(1):8-23.

[3]张俊.信息市场的微观经济分析[J].情报理论与实践,1995(3):8-10.

[4]李正发.传统经济分析的主要视野与缺失[J].湖北省社会主义学院学报,2008(1):56-59.

[5]陈泓霖,马敬.大数据时代下的宏观经济分析[J].统计与管理,2016(5):109-110.

[6]胡新顺,邢凤娇.大数据时代宏观经济分析的相关探讨[J].商场现代化,2016(26):245-246.

[7]姜疆.宏观经济分析如何借助大数据[J].新经济导刊,2016(9):70-74.

[8]刘锋昌.大数据与宏观经济的分析与研究[J].中国市场,2016(42):28-29.

[9]刘涛雄,徐晓飞.大数据与宏观经济分析研究综述[J].国外理论动态,2015(1):57-64.

[10]田睿.大数据时代如何科学发展宏观经济分析研究[J].经济研究导刊,2017(21):1-2.

[11]王聪.大数据时代科学发展宏观经济分析研究[J].经济研究导刊,2017(20):7-8.

[12]王左利.大数据:大数据时代[J].中国教育网络,2013(1):21.

[责任编辑:邓进利]

猜你喜欢
多元回归经济发展大数据
江苏省实施税收优惠政策促进科技创新的实效性研究
我国大学生人生规划自主性的现状和影响因素
中国装备制造业阶段竞争力研究
上证综指收益率的影响因素分析
新常态下中国经济发展战略探究
经济“新常态”下产业结构调整与经济发展的关系
信息化管理在公路运输经济发展中的作用研究
我国对外贸易促进经济发展的研究
基于大数据背景下的智慧城市建设研究