NBA东西联盟数据综合分析

2020-02-22 03:30周泽海
科学导报·学术 2020年56期
关键词:对比研究聚类分析因子分析

周泽海

【摘 要】纵观NBA历史,东部,西部两大联盟的各方面数据的较量始终让人津津乐道,人们站在各自的立场上争论着这两大联盟孰强孰弱。经过了因子分析、K-means聚类以及双样本等方差的t检验得出NBA在2019-2020赛季中西强东弱的局面依然没有改变。

【关键词】NBA;因子分析;聚类分析;对比研究

一、引 言

纵观NBA历史,东部,西部两大联盟的各方面数据的较量始终让人津津乐道,人们站在各自的立场上争论着这两大联盟孰强孰弱。本文将基于2019-2020最新赛季对NBA多元数据进行综合分析。

目前国内外学术界对东西部两大联盟的分析具有代表性的研究有:陈瑾榕,李华,张雪峰论文《对NBA联盟西强东弱格局的探讨》[1]从整体上对目前西强东弱的局面进行探究。沈辉论文《美国NBA与地理》[2]对以地理为视角对NBA进行比较研究文世雄,王新雷,张晓丽,张钰羚论文《2016-2017赛季NBA东、西部决赛球队传球技术应用特征分析》[3]就传球技术对NBA东西联盟进行微观研究。张凯,朱金焕论文《影响NBA东、西部球队得分能力的回归分析》[4]使用回归分析法进行分析。

综合来看现有学术成果都或集中于对微观层面如传球技术的分析,或集中于以较为宏观的地理视角进行分析。本文将从使用NBA中2019-2020的多元数据进行因子分析、聚类分析等,通过多元方法更好对东西联盟进行对比研究。

二、研究方法

1、因子分析是统计学界普遍使用的降维方法,若对其结果进行合理的旋转可得到诸多的解释。

因子分析的数学模型为:

其中,f表示因子,称为公共因子(common factor),我们将多余变量中的信息降维成为因子,达到降维的目的,a称为x在因子f上的载荷(loading),它反映了因子f对变量x的重要性,ε是x;不能被四个公共因子解释的部分,称之为误差或特殊因子(specific factor)。此外设为该行的变量共同度。反映全部公共因子变量对原有变量的总方差解释说明比例。该值越大说明因子分析丢失的信息越低。

2、K-means聚类分析,K-means聚类法通常有3个步骤

(1)选择k个样品作为初始凝聚点,或者将所有样品分成k个初始类,然后将这k个类的重心(均值)作为初始凝聚点。

(2)对所有的样品逐个归类,将每个样品归入凝聚点离它最近的那个类(通常采用欧氏距离),该类的凝聚点更新为这一类目前的均值,直至所有样品都归了类。

(3)重复步骤(2),直至所有的样品都不能再分配为止。

三、样本选择

本文的样本来自NBA中国官网https://china.nba.com/覆盖了东西两联盟全部的队伍。

四、实证分析

首先对数据进行因子分析,这里我们使用主成分因子分解法,因子数为3,旋转方法为最大方差法,当因子数为3时候得出变量共同度为83.574%说明选择因子数为3时即达到降维的目标又保留了足量的信息。

我们发现因子一当中篮板、投射、命中、得分四项的载荷较高,我们将其称之为进攻综合因子,该值越高说明该队伍在场上的攻击性越强。因子2称之为犯规综合因子,该值越高说明该队伍的犯规率较高。因子三称之为球权控制综合因子,该值越高说明该队对对方的抢断越多,球权控制也越多。

对所有球队进行得分计算并将上述结论使用进行聚类分析。首先先要确定聚类数K如图3使用 CCC算法发现2为最佳聚类数。

我们将聚类的均值进行分析如下发现、第一组的特性为进攻性较强、球权控制力较强、同时犯规率也较高。故将第一组称之为强组,第二组的特性为进攻性较弱、球权控制力较弱、同时犯规率也较低。故将第二组称之为弱组。

最后分析强队、弱队是否与东西联盟有影响。我们将强队标记为1、弱队标记为0进行t检验我们发现最终的结果如表8为P=0.0692在显著性水平为0.1的情况下拒绝原假设说明强弱队确实和东西部联盟有关,并且我们发现东部联盟较弱、西部联盟较强。

五、结 论

笔者经过了因子分析、K-means聚类以及双样本等方差的t检验得出NBA在2019-2020赛季中西强东弱的局面依然没有改变。从经济学上可以使用马太效应进行解释,更强的联盟所在的队伍、所在的赛区能够得到更多的门票收入以及广告收入,而这些强队拿到这些资金有可能购买明星球员,为球员提供更好的管理、为球员提供更好的教练,为球员改善硬件设施等而这又会带来队伍整体实力的提升,形成正反馈效应。现代竞技体育已经是一场资金、配套、管理等综合竞争了。

参考文献:

[1]陈瑾榕,李华,张雪峰.对NBA联盟西强东弱格局的探讨[J].辽宁体育科技,2010,32(03):58-60.

[2]沈辉.美国NBA与地理[J].地理教育,2012(05):25.

[3]文世雄,王新雷,张晓丽,张钰羚.2016-2017赛季NBA东、西部决赛球队传球技术应用特征分析[J].体育科技,2019,40(02):1-4.

[4]張凯,朱金焕.影响NBA东、西部球队得分能力的回归分析——以2017-2018赛季为例[J].体育科技文献通报,2019,27(03):70-71.

(作者单位:福州大学)

猜你喜欢
对比研究聚类分析因子分析
农村居民家庭人均生活消费支出分析
诗歌里的低诉,苍凉中的守望
模因论视角下的英汉网络语言对比研究
基于主导产业视角的战略性新兴产业识别以及实证研究
汉藏数词对比
基于省会城市经济发展程度的实证分析
山东省县域经济发展评价研究
实证分析会计信息对股价的影响
传统中药学与生药学的对比研究
基于聚类分析的互联网广告投放研究