微信抢红包最高金额与其影响因素的回归分析

2017-09-20 14:57杜宇静张瑜
科教导刊·电子版 2017年22期
关键词:假设检验参数估计预测

杜宇静+张瑜

摘 要 本文用回归分析的方法研究了微信抢红包最高金额与其影响因素之间的相关关系,建立了分段线性回归模型,对模型的参数进行了加权最小二乘估计和模型的显著性检验,最后用模型做预测分析。

关键词 分段线性回归模型 参数估计 假设检验 预测

中图分类号:F713.3 文献标识码:A

1引言

自2014年微信红包上线后,这一具有趣味性的“抢”红包活动发展迅速,满足当代人的需求。微信红包不但满足了“抢”红包者的好奇感,而且让发红包者的“土豪”心理得到满足.微信红包的最大特点在于设计了拼运气抢红包的使用场景,在抢的过程中,哪怕总额很小的红包,用户还是抱着很大的希望拿个头彩,国内有学者对这个问题做过深入的研究,如罗学强、何斌在《微群心理效应与个体心理现象相关关系分析-以微信抢红包现象为例》中,分析了抢红包与发红包的参与者们的心理现象与心理效应的相关关系;北大学生李星宇在《微信红包的分配秘密》中,分析了新老用户、手机类型对微信红包最高金额的影响。 鉴于微信红包在网络平台上实现,本文通过網络调查问卷的形式收集数据并对微信抢红包最高金额与其影响因素之间的相关关系做具体分析。

2模型的建立

通过网络调查问卷对97位微信红包使用者进行调查获得原始数据,这些被调查者对微信红包的热情、对微信红包应用的熟悉度基本相似,移动运营商的网速基本相同,都没有安装辅助应用。设运气王抢到的最高金额为因变量y,主要考虑下面几个影响因素,设x1为抢红包顺序,x2为红包总金额,x3为微信使用时间,x4为红包总个数。

2.1模型的建立

通过散点图可初步分析因变量与自变量之间的相关关系,下面给出与之间散点图见图1,y与x4之间散点图见图2,其他散点图略。

2.2模型基本假定条件的检验

对一般的线性回归模型的随机误差€%^,通常我们假定,,但在实际问题中这些假定条件往往不成立,首先对x4<10时的线性回归模型,检验是否满足模型的基本假定。

多重共线性是指解释变量之间有相关关系,若多重共线性很严重,致使一些回归系数通不过显著性检验,降低回归方程的应用价值。多重共线性检验的方法有几种,本文引用方差扩大因子法,计算出共线性统计量VIF均小于10, 说明自变量之间不存在多重共线性。

由图3可知,所有的点分布在四个象限,可以判断随机误差项不具有自相关性。另外,用DW检验法可知,当x4<10时,观测值的数目n=45,解释变量的数目k=2,计算得DW=2.407,由DW检验上下界表可知:du=1.57,4du=2.43区间为[1.57,2.43],由du

线性回归模型存在异方差性是指随机误差项具有不同的方差,这样就违背了模型的基本假定条件。我们首先用残差图法检验异方差性,从残差图4中,可以看出随着解释变量值的增加而出现增加的趋势,呈现喇叭口形状,所以可以得出回归模型具有异方差性。另外,可以用等级相关系数法进行检验,即检验随机误差的方差是否相等,原假设的方差相等,得到残差绝对值与自变量的等级相关系数分别为0.284,-0.157,检验的P值均小于0.05,所以回归模型具有异方差性。

同理,当x4≥10时,可以判定模型无多重共线性、无自相关性但有异方差性。

3主要结果

3.1模型的参数估计

3.3预测分析

回归分析的一个主要目的是用来做预测,下面我们用得到的回归方程(3)和(4)做预测分析。

当x4<10时,取x2=10,x4=5,y的真实值为4.22,预测区间[1.796,7.581],通过回归方程(3)计算得到y的估计值为4.94,偏差为0.72。

同理,当x4≥10时,x1=3,x2=50,x4=10,的真实值为10.83,预测区间[5.022,12.594],通过回归方程(4)计算得到y估计值为12.193,偏差为1.363。说明分段回归模型拟合度良好。

4结论

从前面的分析可知,当红包总个数x4<10时,对微信红包最高金额影响最大的因素为红包总金额和红包个数,然而,当微信红包个数x4≥10时,影响最大的因素则为抢红包顺序、红包总金额和红包个数这三个因素。

普林斯顿大学教授、美国科学院院士谢宇在“当代中国社会”研讨课中,把微信抢红包作为插曲,让领到金额最高的学生与教师共进午餐,在15名普林斯顿大学本科生和12名北大本科生中,领到金额最高者绝大多数都是北大学生;只有两位普林斯顿大学的学生领到过最高金额。在谢宇的指导下,北京大学元培学院经济学专业大三学生李星宇对数据展开收集和整理,并进行了统计分析。他们研究得到的结果是微信抢红包是非随机分配金额的,北大学生李星宇在《微信红包的分配秘密》中对此问题做了详细的研究,但他们的研究对象是研讨课的学生,样本很小,而且10次实验之间是高度相关的。因此,两个结果相对比来看并不完全一致,相同点是参与者是否使用苹果设备对于抢到的最高金额没有影响,本文中我们对微信抢红包得到的最高金额与手机类型之间的关系也做了详细的研究,散点图见图5:

从图5中可知手机类型对微信抢红包得到的最高金额并没有影响,而且这两个变量之间的样本相关系数为0.083,等级相关系数0.034,都非常小。但不同的是北大学生在《微信红包的分配秘密》中得出抢到的最高金额与微信使用时间存在先增后减的关系,即使用微信35个月的人更容易抢到最高金额,然而本文得到最高金额与微信使用时间无关,而是受抢红包顺序、红包总金额和红包个数的影响。

如果想控制微信红包抢到最高金额,可以主要从以下几个方面入手:增大抢红包顺序即减慢抢红包的速度,增加微信红包总金额,降低微信红包的总个数。

参考文献

[1] 罗学强,何永斌,李思莹,黄丽珍.微群心里效应与个体心理现象相关关系.分析——以微信红包现象为例[J].电子商务,2016.7,48-51.

[2] 李星宇.微信红包金额真的是随机分配吗?[J].经济资料译丛,2016,4,27-33.

[3] 何晓群.应用回归分析[M].北京:中国人民大学出版社,2011.8.

猜你喜欢
假设检验参数估计预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
基于新型DFrFT的LFM信号参数估计算法
双幂变换下正态线性回归模型参数的假设检验
Logistic回归模型的几乎无偏两参数估计
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
统计学教学中关于假设检验问题探讨
基于向前方程的平稳分布参数估计
基于竞争失效数据的Lindley分布参数估计