【摘要】我相信很多股民都能感受到他们手中持有的股票总是和指数同进退,也就是相关性很强,可是他们不知道具体的相关系数值是多少。本文随机抽取30支股票作为样本对于这个问题给出了点估计与区间估计。同时本文也给出了不同指数间的相关系数值。通过对于这些相关性的研究,大家可以了解到对于在我国想要运用股票组合来降低风险,我们还得进行重新思考。
【关键词】相关系数 点估计 置信区间 系统风险
一、关于相关系数的一些概念
人们经常会遇到的一些确定的函数关系,比如圆的周长S即它和它的半径R之间的关系可表示为S=2ΠR。这是一种确定的函数关系。还有一种是由于有各种不确定的因素的影响,变量间的关系呈现出不确定性,人们称之为相关关系或统计关系,如大家都知道成本可以影响利润,但消费者嗜好也起作用,所以难以给出成本与利润之间的函数关系。在一定的条件下人们可以把相关关系转化为函数关系,如计量经济学家经常这样做,以帮助他们研究一些经济问题。
虽然人们可以通过画图描点来观察变量间的相关关系,但对于变量相关关系的程度却给不出精确的答案。在统计学中有一个比较常用的简单线性相关系数,它可以给出我们想要的答案。本文就是用它来测量个股与指数之间的相关程度的。
二、对股票市场的感受
在股票市场中人们总是能感受到,当市场萎靡时也就是指数下跌时,我们手中的股票下跌的可能性就比较大。所以很多有经验的股民在感受到局势不妙时,就暂时退出市场以免受到更大的损失。基于我的研究,我将告诉你这样做是十分正确的。相信很多人都看得出个股与指数的相关关系很强,但不知道具体的相关系数数值,这正是我想要探寻的。
三、个股与指数的相关系数
在这一部分,我将运用一些简单的统计学的知识给出个股与指数的平均相关关系的均值估计值和其95%的置信区间。通过这些数值大家来看看我们对于股市的感受是不是和这些数值相符合。
我先给出上证指数和股票中国宝安(000009)的相关系数。
上表是通过Eveiws软件计算出来的,当然通过Excel也可以实现这样的目的。在表头Sample中显示了观测数据的起止日期即2015年4月14日到2015年9月2日。Included observations显示观测个数为100。表中Y表示上证指数,X1表示股票000009。同期的相关系数都是0.8680(同期时两个变量的地位相等,数据也无变化)。当Eveiws报告出这个数值时,我确实被吓到了,这比我想象中的还要高!在这里我还要提醒读者,000009有几个交易日是停牌的,我把其停牌日的数据取最近一个交易日的收盘价,这样就造成了计算出来的相关系数值有些偏误(这也是不可避免的),至于是向上的偏误还是向下的偏误我无法判断,但我认为向下的偏误的可能性更大一些。
也许读者已经注意到了在最右边的一列依次显示的是Y(上证指数)各期滞后值与X1(000009)当期值的相关系数也很高,但随着滞后期的增加,相关程度有减弱的痕迹。这也很符合现实,即过去的影响力在减弱。同时时间序列数据一般都是有趋势的,所以Y的过去值和X1的当期值也会有关联。比起它们同期的相关系数也许读者可能更关心Y的滞后值与X1当期值的相关系数。没错我们可以从上表中看到前一天的Y值与今天的X1值的相关系数不仅为正而且还很高。
读者可能会对此提出质疑,因为我计算的相关系数可能不是净的相关系数(偏相关系数),比如上证指数和000009相关,而000009和000096相关以及上证指数和000096也相关,所以出于谨慎态度我给出一个例子来说明这个问题。
下表是000009(X1)和000096(X2)的相关系数,这个结果也是Eveiws报告出来的。
我用日r12代表Y与X1的相关系数,r23代表X1与X2的相关系数,r13代表Y与X2的相关系数,其中r13在后文中我们将会给出。
给出偏相关系数公式如下,以算出000009和上证指数的偏相关系数。
将数值带入公式我们得出的结果是0.907480248,显然我之前给出的0.8680是向下偏误的,这只是一阶偏相关,似乎我应该用两千多阶偏相关系数才是正确的,但是不管怎样它们都处在同一个系统中相互影响,所以我就无需计较它们各自的净影响,还是把0.8680作为我要用的数据更为妥当。
当然这只是000009和上证指数的关系,我下面会给出一个样本容量为30的样本,我将不仅给出它们同期的相关系数而且同时给出Y滞后一期时的相关系数。
以上就是我计算出来的样本股票与上证指数的相关系数和上证指数滞后一期的相关系数。
其中绝大多数股票与指数的相关系数在0.7以上,但也有些比较低。我们特别关心那些和指数相关系数特别低的股票,它们是000096、002143、000025,他们与上证指数的相关系数分别为经营范围:兴办实业(具体项目另行申报);国内商业,物资供销业(不含专营,专控,专卖商品);投资电力企业(具体项目另报);成品油(由分支机构经营);经营液化石油气(限瓶装,经营场地另办执照)进出口业务按《中华人民共和国进出口企业资格证书》办。
主营业务:油品、液化石油气销售及电力投资.是深圳市乃至珠三角地区油品及液化石油气的主要经销商之一。
002143印纪传媒
经营范围:制作、发行,专题、专栏、综艺、动画片、广播剧、电视剧;影视娱乐文化信息咨询,制作、代理、发布户内外各类广告及影视广告;企业形象策划;公关咨询;公共关系专业培训。(在取得相关行政许可后,按许可部门核定的经营项目开展经营活动,未取得相关行政许可的,不得开展经营活动)
主营业务:设计、制作、代理、发布户内外各类广告;传媒娱乐项目投资、娱乐营销;企业形象策划;市场调研服务,会展会务服务;营销信息咨询;公关咨询;公共关系专业培训。
经营范围:投资兴办实业(具体项目另行申报)。国内商业、物资供销业(不含专营、专控、专卖商品)、物业租赁与管理。自营本公司及所属企业自产产品、自用生产材料、金属加工机械、通用零件的进出口业务、进出口业务按深贸管证字第098号外贸审定证书办理。
主营业务:汽车销售、汽车检测维修及配件销售、物业租赁及服务等。
通过对以上3家公司经营范围和主营业务的了解,我感到很吃惊,因为很多人认为像这样几家和经济周期紧密联系的公司其股票应该会和指数的关联性更强一些。对于这个问题的回答,我给出的猜测是,也许我国股票市场本身和经济周期的关联也不强。下面我们利用上面的方法计算出GDP指数(反应经济周期的数据)和上证指数的相关系数。
在上表中我们使用的是季度数据,其中Y表示季度上证指数的收盘价,G表示季度GDP指数。从报告结果来看,它们的关联系数为-0.0917。所以我上文中的推测还算合理。
下面我将给出本文想要做到的,即给出个股与指数相关系数的均值估计值。
上表是个股与上证指数的同期相关系数,我用30个样本数据来估计总体均值。其中点估计是0.792,也就是上表中的样本均值。在95%的置信水平下的区间估计为(0.703926687,0.880073313)。看到这个结果,我们可以对市场多少有些感悟,我们在这个市场中做股票组合对于分散总风险,可能没有多少帮助,因为按这样高的相关系数看,个股的特别风险只占很小的部分,而系统风险占了很大部分。
上表给出的是Y(上证指数)滞后一期与个股的相关系数,同上也是30个样本数据。其中点估计也很高为0.76338667,也就是上表中的样本均值。在95%的置信水平下的区间估计为(0.679158567,0.847614766)。由于这些数据是有趋势的,所以我们也可以得出这样的结果。
上文中提到既然我们不能通过在上证市场中构造股票组合来降低总风险(因为系统风险太高),那么我们可不可以在其他指数如创业板和中小板中挑选一些股票和上证指数中的股票进行组合来降低总风险呢?我给出的回答是否定的,因为上证指数和中小板指数以及创业板指数的相关系数都很高。不仅如此,它们滞后期与当期的相关系数也很高。下面是Eveiws报告出来的结果。
上表是中小板指数和上证指数的相关系数结果。数据是2015年4月14日到2015年9月2日的100个交易日的指数收盘价。其中Y代表上证指数,Z1代表中小板指数。
上表是创业板指数和上证指数的相关系数结果。数据是2015年4月14日到2015年9月2日的100个交易日的指数收盘价。其中Y代表上证指数,Z2代表创业板指数。
上表是创业板指数和中小板指数的相关系数结果。数据是2015年4月14日到2015年9月2日的100个交易日的指数收盘价。其中Z1代表中小板指数,Z2代表创业板指数。
四、总结
通过上面的分析,我得出了一些令人兴奋的结论。
第一,个股和上证指数的相关系数很高在0.79左右,所以我们在上证指数中挑选股票组合以降低总风险的策略效果不佳,因为系统风险占比很高,所以股票组合的总风险依然很高。买个股与买指数基金效果差别不大。
第二,我们也不能通过在不同指数中挑选股票来降低总风险,因为其他指数(创业板和中小板)和上证指数的相关系数也很高,所以我对于在股票市场中降低总风险感到无能为力,但是还有其他品种如债券和不动产等投资对象可以供投资者选择。所以我建议对金融市场不是很了解的人,要合理分配自己的投资比重。
第三,我们在第三部分也看到了,指数的滞后几期和个股间也表现出较高的正相关系数,这可能是因为数据序列是有持续趋势的,或者也可以称其可能符合随机游走。
第四,我在文中也提到了,GDP指数与上证指数的相关性很低,所以一些周期性行业的公司(就是和GDP指数关系密切)未必和指数表现出强的相关性。
参考文献
[1]袁卫.统计学(第三版)[M].2009.
[2]达摩达尔·N·古扎拉蒂.计量经济学基础(第五版)[M].2011.
作者简介:董雪建(1991-),男,汉族,河南省信阳人,云南财经大学硕士研究生,研究方向:金融。