R语言实现金融数据的时间序列分析及建模

2018-01-02 10:31胡泽芃
科学与财富 2018年31期
关键词:时间序列语言

胡泽芃

摘 要: 时间序列在社会中有着广泛的应用,它的研究和预测有着重要意义。国内生产总值(GDP) 是衡量一个国家或地区经济发展水平的指标之一。本文以中国 1997 至 2018 各季度 GDP 值为例,借助 R 语言应用时间序列分析法中的移动平均法,预测中国未来两季度 GDP。比对结果选出较优方案,给出未来四季度预测值。

关键词: R 语言;时间序列;GDP;金融数据

1 前言

国内生产总值(GDP)是指按市场价格计算的一个国家(地区)所有常住单位在一定时期内生产活动的最终成果[1],可在一定程度上反映经济发展状况。时间序列是将统计数据按时间顺序排列形成的数列。时间序列分析是根据时间序列反映出的信息和规律,进行推导,预测下一阶段的发展情况[2]。

2 数据收集和预处理

数据收集

查询中国国家统计局,得相关数据[1]

在比较方法部分,选用 1997Qtr1 到 2017Qtr4 的数据,预测 2018 年前两个季度的数据, 与真实值比较。预测未来四期值时,考虑所有数据。

2 基本方法

移动平均法是用一组与要预测时期最近的真实数据来分析未来发展情况的方法,可用于消除季节与不规则变动,得总体趋势。根据分析元素比重不同,分为简单移动平均与加权移动平均。本文主要应用一次和二次移动平均[3]。

一次移动平均

选 N 个实际值做为一组数据,计算均值作为下一预测值。进行下一轮计算时将取数范围后移一位,即去掉上一个最开始的值,往后多取一位

Mt = (Xt + Xt-1 + … + Xt-N+1) / N ,N 为选取的移动平均项数预测值为 Xt+1 = Mt

用 R 语言画出应用一次移动平均时的趋势线(N=4),计算并将其图像与真实图像结合

此方法对未来两期的预测为 206780.4 亿元和 213379.2 亿元。

二次移动平均

二次移动平均公式如下

Xt+T = at + bt × T at = 2Mt1 - Mt2

bt = 2(Mt1 - Mt2) / (N-1)

+

Mt1 为一次移动平均中的 Mt,Mt2 为前 N 个 Mt1 的均值

计算二次移动平均并将其图像与真实图像结合,预测结果为 220603.5 亿元与 236496.3 亿元。

由上表可得 H-W 預测误差最小

3 结论

本文通过 R 语言应用一次平均,二次平均,H-W 和 ARIMA 来分析预测中国未来季度

GDP。比对结果发现 H-W 预测精度更高,相对误差在 1%以内。用它来估计中国自 2018 年第二季度之后四个季度的 GDP 分别为 232814.3,257524.5,217075.3 和 240109.4(亿元)。

时间序列在社会中应用广泛,本文所使用的方法只是其研究方法的一部分。虽然预测精度可接受,但只适用于短期预测。且主要依据是按时间排列的历史数据,考虑因素较单一。

参考文献

[1]中华人民共和国国家统计局:http://data.stats.gov.cn/easyquery.htm?cn=B01.

[2]华伯泉,统计预测中的二次移动平均法,统计研究,1995,2(64), 70-73.

[3]R 语言实现金融数据的时间序列分析及建模 https://blog.csdn.net/oxuzhenyi/article/detai ls/76615816.

猜你喜欢
时间序列语言
语言是刀
让语言描写摇曳多姿
累积动态分析下的同声传译语言压缩
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于组合模型的能源需求预测
我有我语言