股票市场的高维动态因子模型及其实证分析

2020-06-18 05:57郑红景蒋梦梦
计算机工程与应用 2020年12期
关键词:个数波动股票

郑红景,蒋梦梦,周 杰

西安电子科技大学 数学与统计学院,西安710126

1 引言

收益率和波动率是诸多经济和金融研究的重要方面。收益率反映了金融市场的价格波动,波动率则体现了价格波动的剧烈程度。收益率及其波动情况关系到证券组合的选择和风险管理。现实中一些国内政策及随机性事件,如宏观调控、市场突发事件等都会对股票市场产生影响。目前对这些因素的研究主要有主成分分析、线性回归分析等,但这些方法仅能处理低维数据,尤其是线性回归分析,只能分析特定因素对结果的影响,因此本文构建了动态因子模型(DFM)。动态因子模型可以从数据集中提取少量公共因子,来反映其对股票收益率和波动率的影响。

从现实情形看,科学技术不断发展,政府统计的数据也在增多,由此带来了处理高维数据的难题。动态因子模型是传统因子模型在时间序列方面的推广与发展,擅长处理观测时间点个数大于观测变量个数的数据[1-2]。若观测变量维数较高,且因子的影响有限,观测方程的因子载荷矩阵往往是稀疏阵。目前为止动态因子模型的估计方法有三种,一是状态空间和极大似然估计法[3],但它只能处理低维的动态因子模型。二是提取主成分法[4],三是主成分和状态空间的混合估计法[5],后面两者都不能得到稀疏的因子载荷矩阵。为解决以上问题,本文引入ERM(Expectation-Regularization-Maximization)算法[6],利用ERM可得到高维动态因子模型的稀疏参数估计,而稀疏性也符合金融市场的实际情况。

将提出的模型及算法,应用到深沪交所的股票数据中,发现了收益率模型和波动率模型中都包含共同因子和行业因子,本文也分析了这些因子的波动趋势及其原因。此外,还引入因子贡献率来对比两种因子对行业股票的影响程度。

2 动态因子模型

动态因子模型将n维可观测变量yt描述成由几个不可观测的少量的公共因子xt和均值为0的特质因子εt组成,其基本形式是:

其中,yt,εt∈Rn×1,动态因子的个数是q,所以xt,et∈Rq×1,t=1,2,…,T,滞后算子多项式矩阵λ(L)∈Rn×q,Ψ(L)∈Rq×q,L是滞后阶数,假定Q和R均为对角阵。这里已对yt进行了标准化,去除截距项。

式(1)中模型在没有任何约束的情况下是不可识别的,为使模型可识别[7-8],加入以下约束条件:

(1)本文假定因子载荷矩阵λ(L)的滞后阶数为1阶,并记为C,且限定C的前q-1行,当i=1,2,…,q-1且j>i时,Cij=0。

(2)Ψ(L)为单位阵。

此时,模型可以简写为状态空间模型[9]的形式:

其中, x1~N(μ0,Σ0)。

通过对因子载荷矩阵C的估计,可以得到yt与隐含的公共因子xt的相关关系。若Cij≠0,代表在其他因素保持不变的前提下,股票的公共因子xt每增加一个单位,股票i的取值改变Cij个单位,若Cij=0,则此公共因子不影响股票i。

3 高维因子模型的参数估计

在模型中待估计的量为θ=(C,Q,R,μ0,Σ0),核心问题是因子载荷矩阵C的估计。通常可以通过极大似然估计来计算θ,但在高维情况下,矩阵C是稀疏的,状态空间和极大似然估计法只能处理维度较低的模型,提取主成分法和主成分与状态空间的混合法都无法将C中极小的数值压缩为0。因此,本文采用带惩罚的EM算法(ERM),即在EM算法中加入正则项,以此得到矩阵C的稀疏估计。

ERM算法分三步:E步用卡尔曼滤波和光滑[10]来计算公共因子xt其统计量,并求出条件期望似然函数;R步利用正则化,得到因子载荷矩阵C的稀疏估计;M步极大化条件期望似然函数,得到其余未知参数Q,R,μ0,Σ0的估计,具体算法如下。

E步,动态因子模型的联合似然函数为:

则其对数似然函数的条件期望为:

计算θr时用到的状态变量及它的充分统计量有:

式(6)统计量可由卡尔曼滤波和光滑过程得到。

R步,利用自适应lasso[11]、弹性网[12]和自适应弹性网[13]实现正则化。

首先利用EM算法,通过最大化对数似然函数的条件期望来得到因子载荷矩阵C的不稀疏估计。即Ψ关于C求偏导,有:

令式(7)等于0,C的极大似然估计为:

然后通过极小化损失函数加正则项的方法,用LARS算法实现自适应lasso、弹性网和自适应弹性网估计,来得到稀疏的C。先将式(2a)写成伪回归形式,令:

这里 vec是拉直算子, ⊗表示Kronecker积。则伪回归为:

最大化对数似然函数等价于极小化损失函数,带惩罚的损失函数为:其中,λ是一个调优参数,L(c)是正则项。自适应lasso对应的是,其中,弹性网对应的是,自适应弹性网对应的是

用LARS算法求解式(10),得到c的估计,然后将维数为nq×1的向量c变形为n×q维的矩阵C。随着λ逐渐变大,C中的部分元素会逐渐被压缩为0,当λ足够大时,元素可能全部被缩小为0。因此,适当地确定调优参数λ是很重要的,本文采用的评估依据是扩展的贝叶斯信息准则(EBIC)[14]。

M步,用E步的充分统计量和R步得到的Cr-1,对条件期望似然函数关于Q,R,μ0,Σ0分别求偏导数,令偏导数等于0,得到这些参数的估计:

4 仿真实验

本文共设定了三个仿真实验,且采用三种不同的正则化方法实现估计:

实验1 n=40,q=4,T=300,待估计的因子载荷矩阵C中元素有160个,非0元素占比p分别为10%、20%、30%。

实验2 n=60,q=4,T=300,待估计的因子载荷矩阵C中元素有240个,非0元素占比p分别也是10%、20%、30%。

实验3 n=60,q=4,T=500,待估计的因子载荷矩阵中C元素有240个,非0元素占比p分别也是10%、20%、30%。

三个实验都设定Q=0.01⋅In×n,R=0.01⋅Iq×q。按照以上设计,用100个不同的因子载荷矩阵随机产生100组数据,重复实验。为了评价ERM算法的性能,计算了因子载荷矩阵C的假阳率(FP)和假阴率(FN),计算方法为:

表1 实验1仿真结果(n=40,q=4,T=300)

表2 实验2仿真结果(n=60,q=4,T=300)

表3 实验3仿真结果(n=60,q=4,T=500)

(1)对比三种正则化方法,自适应弹性网的效果优于自适应lasso和弹性网。

(2)对比表1和表2,在控制其他因素不变的前提下,当待估计的元素个数逐渐增加时,FP和FN都会略有增加。

(3)对比表2和表3,在控制其他因素不变的前提下,当观测时间点个数增加时,FP和FN都有减少,这是因为当观测数据增加时,包含的信息也会越来越准确。

5 股票市场收益率和波动率

本文随机选取了深沪交所上市的120支股票(即A股)其中包含通信行业、制造业和互联网行业各30支,其余30支为其他行业股票,数据为2018年1月2日到2018年12月28日(除节假日)的共242天的收盘价。

股票i的第t天收盘价为sit,对数收益率为yit=ln sitln si(t-1)。股票的历史波动率[15]为由于n+1为股票价格时间区间,而本文计算的是日化波动率,则n=1,且对y已进行标准化处理,故hit=|yit|,此时hit全为正数,为使数据更好地服从正态分布,本文将收益率的平方取对数作为对数波动率git=。

5.1 股票收益率模型

在模型估计时,首先要确定公共因子个数,常用的方法有陡坡图法[16]和IC信息准则法[17]等,但当因子相关性较高时陡坡图法会造成重复。除此之外,由于因子载荷矩阵的稀疏性,经IC信息准则法估计出的因子载荷矩阵的某一列可能全部为0,不符合所确定的因子个数,因此也不适用。为解决以上问题本文提出一种新的方法:预先给定不同的因子个数,根据估计的稀疏的因子载荷矩阵,直接得到公共因子的实际个数及实际的因子载荷矩阵。

先假定因子个数分别为q=5,8,9,由此得到了股票收益率模型的参数估计。虽然q个数不同,但因子载荷矩阵C中都只有3列元素有非0元素,且其对应元素位置和大小相似,因此实际上公共因子个数为3。此外因子载荷矩阵中元素绝大部分为正数,可知公共因子与大部分股票收益率呈正相关,即因子向上波动时对收益率有积极影响,反之有消极影响。

5.1.1 通信因子

由于因子载荷矩阵的稀疏性,表4列出的是因子载荷矩阵的第1列中前12支非0元素(按绝对值大小排序)及其对应的股票和所属行业。

从表4可知这些股票大部分属于通信行业,因此可将该公共因子归结为通信因子。通信因子随时间变化的线图,如图1。

图1 通信因子随时间变化线图(收益率模型)

分析图1,发现通信因子在年初、7到8月有小幅度的向上波动,5月因子也有明显的向上波动。

结合政策因素分析,发现在通信行业,2月份发改委通知5G规模组网建设工作逐步展开,5月底,5G已经完成第一阶段全功能标准化工作,进入了冲刺新阶段,7月到8月底,5G技术研发实验第三阶段逐步完成。由此说明了此因子与5G技术的研发有关。

5.1.2 共同因子

因子载荷矩阵的第2列元素大部分非0,表5列出的是前20个(按绝对值大小排序)的非0元素及其对应的股票和所属行业。

由表5可知此公共因子对应的因子载荷矩阵中元素大部分非0,即对大部分股票都有影响,因此可称其共同因子。共同因子随时间变化的线图,如图2。

图2 共同因子随时间变换线图(收益率模型)

由图2可知共同因子在年初、3月下旬、6月15日左右、10月中旬都出现了明显的向下波动,而10月下旬出现了向上波动的趋势,其余时刻处于相对平稳状态。

究其原因,3月份美国推出多项针对中国的贸易措施,导致A股大幅下跌。6月份美国再度加息,同时对华贸易争端升级,对国内股市影响加大。而10月底,面对A股沪指的弱势,央行、银保监会全力维稳市场,同时也推出各项改革政策致力于稳定我国股票市场。

表4 通信因子影响的股票(收益率模型)

5.1.3 制造因子

表6是因子载荷矩阵的第4列中前12支非0元素(按绝对值大小排序)及其对应的股票和所属行业。

从表6可以看出,这些股票大多是制造业,故将此公共因子归为制造因子。制造因子随时间变化线图,如图3所示。

图3 制造因子随时间变换线图(收益率模型)

由图3知,制造因子在6月中下旬有明显向下波动的现象,而在10月下旬到11月初因子向上波动。结合当前形势,这与中美贸易战争有关。6月份,美国加大了中国出口货物的税率。但在10月份,我国深入实施推进制造业建设解决深层次矛盾,对制造业产生了积极影响。

5.2 股票波动率模型

与收益率模型一样,也假定因子个数分别为q=5,8,9,由此得到了股票波动率模型的参数估计,所有因子载荷矩阵C中都只有2列元素有非0元素,且其对应元素位置和大小相似,因此实际上公共因子个数为2。且因子载荷矩阵中元素绝大部分为正数,可知公共因子与大部分股票波动率呈正相关。

5.2.1 共同因子

因子载荷矩阵的第1列元素大部分非0,表7列出的是前20个的非0元素(按绝对值大小排序)及其对应的股票和所属行业。

由表7可知此公共因子影响全国大部分股票,故称其为共同因子。共同因子随时间变化的线图,如图4。

表5 共同因子影响的股票(收益率模型)

表6 制造因子影响的股票(收益率模型)

表7 共同因子影响的股票(波动率模型)

图4 共同因子随时间变换线图(波动率模型)

由图4可知共同因子在1月下旬、5月底、10月中下旬都出现了明显向下波动,其余时刻波动相对较小。

从政策方面看,1月金融监管政策密集出台,货币政策也致力于维持流动性稳定,5月中美贸易关系日趋紧张,美国以贸易战为突破口实施对华遏制战略,旨在打击我国对外贸易,10月份外围氛围争端持续升级,国内经济增长已然持续承压。由此可见,中美贸易战争对我国金融市场产生了很多负面影响。

5.2.2 互联网因子

表8是因子载荷矩阵的第3列中前12支非0元素(按绝对值大小排序)及其对应的股票和所属行业。

表8中股票大多为互联网行业,可将此公共因子归为互联网因子。互联网因子随时间变化的线图,如图5。

图5可以看出,互联网因子在2018年大多数时间都是呈现向上的波动,这与2018年人工智能领域的快速发展有关。因子在8月7日和11月中下旬有两次明显的波峰,这应该是与国家政策有关,8月有20多个省市发布相关文件和扶持政策,10月31日中共中央政治局进行的集体学习中,习总书记强调了人工智能发展的重要性。

图5 互联网因子随时间变换线图(波动率模型)

5.3 收益率模型和波动率模型的异同

5.3.1 公共因子类型异同

分析两个模型的两个共同因子,发现两者波峰和波谷出现的时间和原因有相似之处,这是因为国内金融市场的重大事件如中美贸易争端和政府出台的政策措施,对两者均有影响。但其他因子只对二者之一产生影响,如在收益率模型中的通信因子只对通信行业的收益率产生了影响;而波动率模型中的互联网因子只对互联网领域的波动率有影响。

5.3.2 模型中各公共因子的贡献率

由于共同因子影响大部分股票,而行业因子只影响某行业股票,为研究两种因子对行业股票的影响程度,本文进一步利用方差分解的方法进行度量。基本原理是:计算每个行业因子和共同因子的方差vi占总方差的比例作为因子的贡献率,即。具体结果见表9。

由表9可知,在收益率模型的通信行业和制造业,共同因子的贡献率比行业因子的贡献率略大,说明共同因子对股票收益率的影响要大于行业因子。但在波动率模型中互联网行业的行业因子贡献率要远大于共同因子,也就是说股票波动率受行业因子的影响更大。

6 结束语

本文基于高维动态因子模型,建立了金融市场的收益率和波动率模型,引入ERM算法得到了稀疏的参数估计。通过对沪深交所股票市场的分析,两个模型中都有一个因子影响大部分股票,为共同因子,而其他因子是只对部分行业股票有影响的行业因子。本文分析了这些因子产生波动趋势,并给出了可能的解释,此外,通过计算因子贡献率,发现通信行业和制造业股票的收益率更易受共同因子的影响,而互联网行业股票的波动率更易受行业因子的影响,这些发现为研究金融市场的收益与风险提供了新的视角。以上研究是对金融市场动态因子模型的初步探讨,也可从其他方面进行研究,如分层动态因子模型,这些研究对理解金融市场的影响因素也有重要的意义。

表8 互联网因子影响的股票(波动率模型)

表9 各因子方差及贡献率

猜你喜欢
个数波动股票
怎样数出小正方体的个数
等腰三角形个数探索
怎样数出小木块的个数
羊肉价回稳 后期不会大幅波动
11月汇市:波动率降低 缺乏方向
微风里优美地波动
2019年国内外油价或将波动加剧
怎样数出小正方体的个数
本周创出今年以来新高的股票
本周创出今年以来新高的股票