基于灰色关联度分析的量化投资策略研究

2020-06-16 11:23李俊林董安强
太原科技大学学报 2020年4期
关键词:技术指标时间段关联度

梁 艳,李俊林,董安强

(太原科技大学应用科学学院,太原030024)

量化投资是运用数学、统计学的方法,通过分析大量历史数据来寻找数据之间的规律,并应用所得规律构建投资策略用于实践。近年来随着国内股市的不断发展壮大,量化投资方法开始盛行,成为近年来股市研究的流行趋势之一。

2012年,丁鹏[1]撰写了国内第一本关于量化投资的书,书中详细介绍了量化投资的各个方面。国内量化投资起步晚,发展不尽完善,当前国内市场所使用的量化方法,大多数围绕量化选股进行。2013年,孙守坤[2]以Alpha收益理论为指导,利用业内流行的多因子模型,结合中国A股市场的实际数据进行量化选股的实证分析。2015年,刘宇霞[3]构建了两个单一指标择时策略模型以及组合指标择时策略模型,并分别进行交易仿真回验,结果表明组合指标所构建策略的效益要优于单一指标策略的效益。2016年,王淑燕、曹正凤、陈芷铭[4]对国内外学者量化选股选用的指标体系进行了分析,应用相关分析对指标进行了研究,以六因子模型为基础,进而构建了八因子选股模型指标体系,并通过对比分析验证了该量化选股模型的性能。2017年,王赟[5]应用灰色关联分析法分析了因子和股票收益率的相关性以及相关程度稳定性,以此来进行有效因子的选择,进而构建了投资组合,并验证了模型的有效性。对于股票技术指标的研究大多是用指标预测股市走势即验证其有效性,2009年,方匡南[6]等人应用聚类分析和决策树模型对多个股票技术指标做了研究,结果显示各指标两两之间相关程度均不相同且技术指标确实能够对股票的买入、卖出时机做出预测。2012年,方智[7]针对多个股票技术指标,应用聚类分析以及灰色关联度分析法对其进行了研究,并采用决策树模型及神经网络对股指走势及点位做了预测。2014年,李俊林、韩晓丽、王永昌[8]提出了股票资金流强弱指数这一指标,并对其进行了实证分析。2017年,巨红岩、李俊林、董安强[9]应用Copula函数对上海股票市场资金流强弱指数相关性做了进一步的研究,结果表明沪市资金流强弱指数之间的尾部性质能够用 Gum-belCopula 函数进行刻画。

当前国内学者对量化投资策略的研究大都围绕多因子选股模型展开,多因子选股模型以多个因子(主要考虑股票基本面信息)作为选股的标准,从中选择因子打分高的股票构建量化投资股票组合。本文则是针对股票技术指标,将传统的相关分析、聚类分析与灰色关联度分析相结合,选取了各指标五年的历史数据,根据技术指标的相关性,从众多技术指标中选出指标组合,构成量化选股指标组合,进而构建了量化投资策略,该策略可以为股民的投资进行指导,能够在一定程度上避免盲目投资带来的巨大损失,具有现实的研究意义。

1 灰色关联度分析法介绍

1.1 灰色关联分析法

灰色关联度分析法[10]是通过分析因素的历史数据,借助灰色关联度来考察各因素间的大小、强弱和次序关系。该方法简单易行,对数据要求较低,能够很好地降低数据缺失对研究结果所造成的影响,广泛应用于社会生活的各个领域,尤其在经济金融领域。它的过程一般为:对所研究的系统Si(i=1,2,…,n),构造研究所需的参考序列X0=(x01,x02,…,x0m)和比较序列Xi=(xi1,xi2,…,xim),接着对参考序列及权系数向量ρ(ρ∈[-1,1])进行确定,根据上述条件来计算关联系数ξi(k)以及关联度ri,再以关联度大小为依据对变量进行大小排序。其中关联系数ξi(k)和关联度ri分析别通过下列公式计算:

(1)

(2)

本文应用灰色关联度分析法对多个股票技术指标进行分析。灰色关联度分析法只考虑到参考序列和比较序列间的关系,并未考虑到比较序列两两之间的相关性,本文针对这一问题做了处理,对原有方法做了改进。

1.2 改进的灰色关联分析法

考虑到变量间两两的相关性,本文所用的分析方法是将相关分析、聚类分析[11]与灰色关联度分析法结合的研究方法,称之为“改进的灰色关联度分析法”,其分析步骤如下:

步骤一:通过相关分析,采用泊松相关系数来衡量指标间的相关性。

步骤二:利用得到的相关系数对指标进行聚类分析,将指标分成若干类。

步骤三:对聚类得到各大类指标进行灰色关联度分析,从各类中选出关联度最大的指标,组成量化指标组合。

相对于原灰色关联度分析法,改进之后的灰色关联度分析法对于所研究的各指标间的相关性进行了处理,而原灰色关联度分析法没有考虑这一因素,很可能导致选出的指标间相关程度较高,使分析结果比较片面,不具有代表性。

2 技术指标介绍

2.1 常用技术指标介绍

本文选用了22个常用的股票技术指标,它们所属指标类型如表1.

2.2 技术指标参数设置

各技术指标的参数依据股票软件上常用参数来设置,具体见表2.

表1 常用指标类型

表2 常用技术指标参数设置

本文研究的是上述22个指标在不同参数、不同情况下的具体指标,共有37个。为了方便下文对技术指标的研究,本文对上述22个技术指标在不同参数、不同情况下的37个具体指标进行编号如下:

1.SFFI(5),2.SFFI(10),3.SFFI(20),4.MA(5),5.MA(10),6.MA(20),7.MA(60),8.MACD, 9.DMA.DIF,10.DMA.DIFMA,11.DMI.ADX,12.DMI.ADXR,13.TRIX,14.EMV,15.SAR, 16.CCI,17.KDJ.K,18.KDJ.D,19.KDJ.J,20.BIAS6,21.BIAS12,22.RSI6,23.RSI12, 24.BOLL.BOLL,25.BOLL.UB,26.BOLL.LB,27.WR10,28.WR6,29.MFI,30.ROC, 31.BRAR.BR,32.BRAR.AR,33.OBV,34.CR,35.VR,36.RSY,37.MTM.

3 量化投资策略

3.1 指标筛选

本文选取了上证A股指数各指标2010.05.04——2015.05.22共计五年的日交易数据,运用改进之后的灰色关联度分析法对其进行分析。首先对各个指标进行相关分析,应用SPSS软件对数据进行处理得到了技术指标两两之间的相关系数,某一指标与其他37个指标相关系数散点图如图1(其它指标情况均类似):

图1 相关系数散点图Fig.1 Correlation coeffcient scatter plot

由图1可得出:技术指标两两之间的相关程度各不相同,根据相关系数能够将指标分成若干类,因此可先对各个指标做分类处理,再进行下一步分析。

根据指标间的相关程度,应用SPSS软件对37个股票技术指标做了聚类分析,由聚类结果可得,将这些指标分为五类较合适,具体分类如下:

第一类:MA20,BOLL.BOLL,SFFI20,BOLL.UB,SFFI10,MA10,SFFI5,MA5,SAR,BOLL.LB,MA60,OBV,VR;

第二类:DMA.DIF,DMA.DIFMA,TRIX, BRAR.BR, CR,BRAR.AR;

第三类:ROC,MTM,EMV,MFI,MACD,KDJ.K,KDJ.D,RSI6,RSI12,BIAS12,CCI,KDJ.J,BIAS6,PSY;

第四类:DMI.ADX,DMI.ADXR;

第五类:WR6,WR12

对聚类分析得到的各大类指标进行灰色关联度分析,灰色关联度分析需要计算参考序列与比较序列的关联度,参考序列的选取是本文的关键。

由于要从上证A股众多股票中选出某些股票作为股票池,然后分析其收益率,所以选取与上证A股股票收益相关的数据作为参考序列,一般收益率的定义为:

(3)

式(3)中:Pt、Pt-1分别表示第t、t-1天的股价指数。 又因为Ln(1+Rt)的泰勒展开式为Rt,为了计算方便,本文选取上证A股指数对数收益率为作为参考序列。

通过MATLAB程序计算得出各大类指标的关联度及其大小排序,整理如下:

第一类指标的关联度:

rMA(20)=0.834 8,rBOLL.BOLL=0.834 8,rSFFI(20)=0.834 8,rBOLL.UB=0.836 8,rSFFI(10)=0.836 7,rMA(10)=0.836 8,rSFFI5=0.838 0,rMA(5)=0.838 0,rSAR=0.835 6,rBOLL.LB=0.833 0,rMA(60)=0.828 1,rOBV=0.855 8,rVR=0.850 7.

指标关联度大小排序:

rOBV=rVR>rSFFI(5)=rMA(5)>rBOLL.UB>rSFFI(10)=rMA(210)>rSAR>rSFFI(20)>rMA(20)>rBOLL.BOLL>

rBOLL/LB>rMA(60)

第二类指标关联度:

rDMA.DIF=0.838 8,rDMA.DIFMA=0.848 0,rTRIX=0.842 7,rBRAR.BR=0.845 6,rCR=0.846 3,rBRAR.AR=0.842 5

指标关联度大小排序:

rDMA.DIF>rDMA.DIFMA>rCR>rBRAR.BR>rTRIX>rBRAR.AR

第三类指标关联度:

rROC=0.853 5,rMTM=0.856 2,rEMV=0.850 2,rMFI=0.838 8,rMACD=0.847 0,rKDJ.K=0.832 8,rKDJ.D=0.826 0,rRSI6=0.859 3,rRSI12=0.852 3,rBIAS12=0.868 7,rCCI=0.847 5,rKDJ.J=0.842 1,rBIAS6=0.888 0,rPSY=0.844 1

指标关联度大小排序:

rBIAS6>rBIAS12>rRSI6>rMTM>rROC>rRSI12>rEMV>rCCI>rMACD>rPSY>rKDJ.J>rMFI>rKDJ.K>rKDJ.D

第四类指标关联度:

rDMI.ADX=0.826 4,rDMI.ADXR=0.827 0

指标关联度大小排序:rDMI.ADXR>rDMI.ADX

第五类指标关联度:

rWR10=0.787 3,rWR6=0.781 1

指标关联度大小排序:rWR10>rWR6

各指标的关联度越大,表示指标对上证A股收益率的作用程度越大,分别从各类中选出关联度最大的指标,组成量化选股技术指标组合,这五个指标分别为:OBV,DMA,ROC,DMI,WR.

3.2 指标组合参数选取及买卖规则

通过上述方法选出技术指标组合后,需要对指标组合的参数进行选择及买卖规则进行确定,参数选择如表3,买卖规则如表4:

表3 指标组合参数选取

3.3 股票买卖点的选择

找出五个指标在选股时间段内的买点(可能有多个),在五个指标相继出现卖点之后,股票买入时间点在选股时间段的最后一天及其之后时间。股票买入点股票买卖时间点的确定:(1)若指标在选股时间段最后一天前一两天出现买点且股价最近小幅波动,则股价较低的时间买入股票;若某指标在选股时间段之后的时间出现买点且最近股价呈上涨趋势,则该点可以买入股票;若威廉指标在选股时间段之后时间出现买点,且该买点出现三天内(包含买点)没有再出现买点,则可在该买点出现的第三天买入股票;(2)从买入点起,若第二天股票就出现下跌趋势,则在当天卖出股票;若股票先涨后跌(涨跌都是相对于入手价来说)持股期间,若股票最大涨幅超过10%且连续收益天数超过五天,则在股票连跌三天或者最大跌幅超过10%时卖出,若股票最大涨幅低于10%,则在股票出现下跌的点就将股票卖出,对于股票轻微下跌(跌幅在1%左右)暂时不做卖出。根据以上条件可以确定股票买入时间(选股时间段最后一天及其之后时间点)。

运用通达信软件,根据上述指标组合参数选择及买卖规则进行技术指标条件选股公式的编写,并且根据股票买卖点构建量化投资策略。

4 量化投资策略实证分析

对上述量化投资策略进行实证分析,设定选股周期为日线,选股范围为上证A股。首先选取时间段为2015年6月1日到6月19,对上述量化投资策略进行条件选股,共选出了华夏银行(600015)、上汽集团(600104)、三峡水利(600 116)、太原重工(600169)、民丰特纸(600235)、中铁工业(600528)、天地源(600665)、中航资本(600705)、广誉远(600771)、北京银行(601169)、农业银行(601288)、新华保险(601336)、工商银行(601398)、光大证券(601788)、中国石油(601 857)、招商轮船(601872)、方正证券(601901)、中国银行(601988)、火炬电子(603678)等19支股票,对这些股票分别从股票的买入时间,持股时间(按照买卖点规则,若持股时间段超过一个月则取一个月),持股时间段(最多取一个月)的累计收益、平均收益率、最大涨跌幅几方面进行分析得:19支股票中,有13支股票在持股时间段内累计收益均为正,有8只股票平均收益率超过5%,说明股票持股时间段内收益较显著。有6支股票的持股天数达到了21,说明股票可以保证较长时间的收益,由此证明了量化投资策略的可行性。

为了进一步验证股票量化投资策略的有效性,又选取了其它几个时间段进行选股验证,选股结果分析同上,选股成功率按持股天数累计收益来计算,若累计收益为正,则选股成功。验证结果如表5:

表5 量化选股结果统计

由上表分析得:在上述五个选股时间段中,总体量化选股成功率较理想,以上每个时间段大都可以保证累计收益为正,说明了量化投资策略的可行性,但个别时间段选出的股票个股表现一般,平均涨幅与持股天数方面表现不太好,有待改进。

5 结论

本文对原灰色关联度分析法做了改进,将相关分析、聚类分析方法与之相结合,运用改进之后的方法对多个指标进行了筛选,并对其结果做了进一步分析,得到了以下结论:

(1)技术指标两两之间的相关程度各不相同,根据相关系数对各个技术指标进行聚类分析,可将多个指标分为若干类,最后从聚类所得各大类中选出关联度最大的指标,得到了量化指标组合。

(2)对量化指标组合进行参数选取及买卖规则确定,并对股票买卖点进行了选择,从而得到了量化投资策略,并通过多个时间段的选股分析验证了量化投资策略的可行性和有效性。

猜你喜欢
技术指标时间段关联度
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
基于熵权法改进的TOPSIS法和灰色关联度分析的压榨脱水过程优化研究
夏天晒太阳防病要注意时间段
中国制造业产业关联度分析
中国制造业产业关联度分析
发朋友圈没人看是一种怎样的体验
技术指标选股
技术指标选股
“三天后”是啥时候?
技术指标选股