基于模糊主成分分析的足球比赛因素分析

2021-09-03 06:53王武
文体用品与科技 2021年16期
关键词:任意球角球中超联赛

王武

(天津理工大学中环信息学院 天津 300380)

中国足球超级联赛(简称“中超联赛”)是中国最顶级的足球联赛,目前有16支队伍,每个赛季进行主客场循环比赛,目前已成为东亚地区最有影响力的足球赛事。2019-2020赛季于近日结束,江苏苏宁、广州恒大、北京中赫国安取得了联赛前三名。本文选取中超联赛在2019-2020赛季16支球队的总数据,通过模糊主成分分析,对相关数据做分析。

竞技体育的最大魅力是比赛结果的不确定性,在足比赛中,影响最终比赛胜负的因素主要有射正、助攻、角球、任意球等。本文第一部分将选取中超联赛在2019-2020赛季16支球队的射正、助攻、角球、任意球四个数据的赛季总数据,通过主成分分析,将其归纳为一个主成分,并对结果做出分析。

本文以“2019-2020赛季中超联赛、比赛结果分析”等为主要关键词,通过中国知网、万方知识服务平台等数据库,对2003-2019年12月已有研究进行检索,搜集期刊文章20余篇,权威报纸报道30余篇,并在“国际足联、中国足协、网易、新浪、搜狐体育”等官网查阅和下载了与研究内容有关的资料并进行整理,为本研究提供了理论支撑。同时,为更好的开展研究,对“天津体育学院、天津师范大学、天津泰达足球俱乐部等知名学者、运动员就“足球比赛的制胜因素、足球比赛胜负预测”进行访谈,以便获得真实可靠的资料。表1。

表1

1、数据选择与处理

选取中超联赛在2019-2020赛季16支球队的射正、助攻、角球、任意球四个数据的赛季总数据。

未处理的数据具有离散性、随机性等特点,故应对选取的数据进行标准化处理,本文采用z-score标准化处理方法。具体步骤为:

(1)在上述11个影响因素中,失误和犯规为负面影响因素,故对这两类数据取相反数;

(2)将(1)中处理后的数据记为矩阵 X=(Xij),i=1,…,5,j=1,…,11,即用xi·表示相应比赛场次的比赛数据,例如x3·表示第三场,中国对与委内瑞拉对的比赛数据。记第i列数据的平均值为,则数据标准差为,则第j列数据的标准化为。

对选取的数据进行z-score标准化处理后,可得到变准化数据并采用z-score标准化进行标准化处理。得到处理后的数据如

表1选取中超联赛在2019-2020赛季16支球队的射正、助攻、角球、任意球四个数据的赛季总数据,并采用z-score标准化进行标准化处理后的数据。

2、构造协方差矩阵

在统计学与概率论中,协方差矩阵的每个元素是各个向量元素之间的协方差,是从标量随机变量到高维度随机向量的自然推广。

令 X=(x1,x2,…,Xn)为 n 维随机变量,cij=Cov(Xi,Xj)为第 i 个向量与第j个向量的协方差。则其相应的协方差矩阵为:

则其相应的协方差矩阵为:

3、主成分分析

在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。

主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。主成分分析的具体步骤如下。

通过MATLAB计算得到协方差矩阵的4个特征值,从大到小排列有:

表2 协方差矩阵的特征值

第一个特征值得和为2.09,四个特征值的和为3.99,则第一个特征值占总特征值的53%,即第一个特征值所对应的综合因子影响比赛的程度超过50%。

图1 方差贡献直方图

图2 方差贡献散点图

第一个特征值所对应的特征向量为[0.65,0.48,0.58,0.07]。记其所对应的综合影响因子为第一主成分,记号分别为F1。第一主成分所对应的综合因子可表示为F1=0.65X1+0.48X2+0.58X3+0.07X4,16支球队所对应的第一主成分的取值z-值见下表

表3 16支球队相应的z-值

图3 各球队z-值散点图

在上表中,z-值越大,说明球队在2019-2020赛季的表现越好,z-值越小,说明球队在2019-2020赛季的表现越差。

4、结果分析以及对各球队的建议

4.1、结果分析

通过主成分分析对2019-2020赛季中超联赛16支球队数据进行分析,根据结论有如下结果。

在第一主成分中,射正所对应的系数为0.65,这说明在足球比赛中,射正对比赛的胜负影响最大,诚然在比赛中,射正的次数越多,进球的可能性就越多,获得比赛胜利的可能想就越大。任意球所对应的系数为0.07,这说明任意球相对其他因素来说对比赛胜负的影响较小。

各球队的z-值中,江苏苏宁、广州恒大、北京中赫国安所对应的z-值较大,说明这三支球队在2019-2020赛季中超联赛中表现最好。据查,江苏苏宁、广州恒大、北京中赫国安获得了2019-2020赛季冲超联赛的前三名,这也与我们的结论一致。

4.2、对各球队的建议

用过上述结果越分析,现对中超联赛各球队给与以下建议。

首先,球队射门数与射正数是获得比赛的最根本保证,各球队在训练时应该加强对射门的训练以及有关射门的配合;

其次,相对于任意球来说,角球对比赛胜利的贡献度较大,故各球队应加强角球训练,强调角球战术的重要性;

最后,助攻数是球队整体配合的表现,各球队应加强相应的战术体系建设与战术配合。

中国足球超级联赛一直是世界上较强的足球联赛,近年来由于人才培养、足球协会改革等因素影响,中超联赛的影响力逐步提升。相信随着中国足球体制改革、国内足球人才的培养等因素的提升,中国足球超级联赛一定能走向世界,逐步提升中国足球在国际足球领域的影响力。

猜你喜欢
任意球角球中超联赛
赛会制视角下中超联赛不同水平球队位置球员跑动表现分析
羊角球跳跳跳
跳羊角球比赛
新王登基!江苏苏宁获2020赛季中超联赛冠军!
2016赛季中超联赛角球进攻战术特征研究
人名解读
高水平足球比赛中快发任意球战术的实践应用研究①
对第十六、十七届世界杯前场任意球进攻剖析
喊什么喊?