基于主成分分析和Q型聚类分析的2018年俄罗斯世界杯足球赛各队技战术综合分析

2020-02-14 05:58李毅伟宋松
计算机时代 2020年1期
关键词:失球进球技战术

李毅伟 宋松

摘  要: 通过查阅文献以及依据2018年足球世界杯数据库,选取了反映球队技战术综合能力的14项指标,对2018年俄罗斯世界杯足球赛决赛阶段32强,64场比赛的技战术指标进行统计,使用主成分分析法和Q型聚类分析法对该届世界杯各队的技战术数据进行分析,进一步使用斯皮尔曼相关系数法和方差分析法对上述分析进行了检验。结果表明,使用主成分分析法和Q型聚类分析法对足球队的技战术指标进行量化,具有较高的有效性及可靠性,能够客观的反映球队的技战术能力,可以作为各队实力的重要参考。

关键词: 2018年世界杯; 足球; 主成分分析; Q型聚类分析; 方差分析

中图分类号:O212.4          文献标识码:A     文章编号:1006-8228(2020)01-57-05

Abstract: According to the literature review and the 2018 FIFA World Cup database, 14 indexes reflecting the comprehensive technical and tactical ability of the team are selected. The technical and tactical indexes of the most powerful 32 teams 64 matches in the final stage of the 2018 FIFA World Cup are statistically analyzed, and the technical and tactical data of each team in the 2018 World Cup are analyzed by principal component analysis and Q type cluster analysis, and the results are further verified by the method of Spearmans correlation coefficient and variance analysis. The result shows that the use of principal component analysis and Q type cluster analysis to quantify the technical and tactical indicators of the football team has high effectiveness and reliability, can objectively reflect the technical and tactical capabilities of the team, can be an important reference for the strength of each team.

Key words: the 2018 FIFA World Cup; football; principle component analysis; Q type cluster analysis; variance analysis

0 引言

足球世界杯是世界上最高水平的足球比赛,代表着世界足球运动发展的趋势和潮流。每4年举办一次,2018年俄罗斯世界杯足球赛共有206个国家和地区的足球队参赛,而获得2018年俄罗斯世界杯决赛阶段资格的仅有从预选赛中出现的31支球队和东道主俄罗斯国家队。决赛阶段共32支球队进行64场比赛,经过激烈的竞争,2018年7月16日,法国队在决赛中4∶2击败了克罗地亚队,获得大力神杯。亚洲球队表现依旧不容乐观,只有日本队小组出线。在此届世界杯上,国际足联专业分析团队根据每一场比赛反映的技战术指标做了科学的分析,其中涉及影响比赛的重要技术指标有进球、助攻、射门/射正、扑救、抢断、控球率等14项指标。本文在此基础上对这14项影响比赛的重要技术指标与比赛结果进行相关性分析,探索这些指标与比赛结果之间存在的关联。揭示世界足球的技战术发展趋势,并探索出一种较为合理有效的量化评价球队技战术能力的方法,为亚洲球队的发展提供参考,也为我国的足球发展方向提供依据。

1 研究对象

1.1 研究对象

以参加第21届世界杯足球赛的32支球队,共计64场比赛为研究对象。从网易世界杯数据中心网站[1]获取2018年世界杯比赛相关数据,对进球、助攻、射正/射门、扑球、犯规、被侵犯、越位、角球、黄牌、红牌、传球、拦截、抢断以及控球率等14项主要技术指标与球队比赛的胜负结果进行相关性分析,分析各项技术指标对比赛胜负走势的影响。研究影响比赛胜负的主要因素。

1.2 研究方法

文献资料法:通过检索和查阅有关2018年俄罗斯世界杯以及足球各种技战术等相关文献资料[2-7]。

数理统计法:1观察和整理巴西世界杯参赛球队的数据统计,采用EXCEL软件对各项技术指标进行统计处理。2采用SPSS统计软件对32支球队的14项指标进行主成分分析和Q型聚类分析、等级相关分析以及方差分析[8-9]。

2 统计方法

2.1 主成分分析

由于原始数据较多,且存在一定的相关性,在使用高度相关的指标难以实现合理的聚类。因此,需要引入一组新的互不相关的,但又尽可能完整保留原始数据信息的新变量,同时达到降维的目的,使复杂问题简单化[5],主成分分析很好的实现了这一目的。

主成分分析利用降维的思想,在力保数据信息损失最少的原则下,用几个综合性的指標替换掉原来的数据,使其尽可能的反应原来的变量信息。将转化生成的综合指标称为“主成分”。主成分是原始变量的线性组合,且主成分之间相互独立,这样只需用少数几个主成分研究复杂问题既不丢掉原始数据的主要信息,又容易抓住主要矛盾,避开变量之间共线性问题,便于进一步分析,提高效率[5,9]。

2.2 Q型聚类分析

原始数据经过主成分分析后得到彼此互不相关的主成分。在此基础上,对这些新的主成分变量进行Q型聚类分析。Q型聚类分析是根据被观测的样品的各种特征,将特征相似的样品归为一类的方法。将不同样本归为一类的标准是样本之间的距离。本文选用离差平方和法(Ward方法)来刻画样本之间距离。该方法适合处理小样本数据,对异常值敏感,比较符合实际需要[8-9]。

3 数据处理与结果

3.1 主成分分析

首先对14个技战术指标形成的统计数据进行主成分分析,求出指标的特征值和贡献率,如表1所示,结果表明,特征值不小于1的因素一共有5个,前5个主成分的累计贡献率超过74%,认为前5个主成分提供了足够多的信息,因此选择前5个主成分作为聚类分析的指标数据。

3.2 Q型聚类分析

使用主成分分析法得到的互不相关的5项能综合反映本次世界杯技战术主成分的指标后,使用Q型聚类对其进行分析[2-7]。这里采用离差平方和法(Ward法)进行聚类。聚类结果如图1所示。

4 结果与分析

4.1 结果

从图1可知,聚在第一类的有11支球队,占参赛队伍的34.38%。排名分别是1、2、5、6、聚在第四类的有9支球队,占总数的28.12%。排名分别是4支16强,5支32强。以上结果表明,聚类结果与参赛队伍的排名基本一致,传球成功率高,射门效率高,反击次数较多,以及抢断能力强,犯规次数少的球队比赛成绩相对较好。

与聚类分析等级一样,将研究的32支球队按照成绩等级分成四个等级,1至8名为第一等级;9至16位第二等级;17至24位第三等级,25至32为第四等级[6]。计算结果为[rs=0.989186]。表明聚类结果与比赛成绩之间具有很强的相关性,聚类结果比较客观真实的反应了比赛的结果。证明所采用的方法所得的指标是能够有效反应球队的进攻和防守的整体技战术能力,因此,研究具有理论和实践方面的双重意义。

4.2 分析

4.2.1 总体分析

从统计结果来看,聚在第一类的球队共进球82个,平均每队每场进球1.53个,失球69个,平均每队每场失球1.46个。进失球比率为1.05:1。聚在第二类的球队共进球48个,平均每队每场进球2.45,失球35个,平均每队每场失球2.02,进失球比率为1.21:1。聚在第三类的球队共进球36个,平均每队每场进球1.02,失球43个,平均每队每场失球1.46个,进失球比率为1:1.43。聚在第四类的球队共进球29个,平均每队每场进球0.9,失球个48,平均每队每场失球1.57,进失球比率为1:1.74[6]。

前两类都有较高的平均进球率。且进球率均高于失球率。由此可知攻守平衡是取得好成绩的关键。虽然平均进球第一类低于第二类,但是平均失球率也低于第二类。且聚集在第一类的球队有较高的射门转化率,能将有限次的射门转化为进球。且相较于第二类,第一类犯规次数少,红牌少,平均每场传球在四类中居首位,抢断积极,控球率也高,正是这些原因使得第一类的球队最后取得了相对较好的成绩。

聚在第三类和第四类的球队,明显的进球少,失球多。这两类球队的攻守技战术能力较弱,进攻能力差,且防守能力也不高。具体表现为控球率低,抢断不积极,助攻少,角球机会少,黄牌、红牌较前两类多。从侧面印证了攻守平衡是球队取得好成绩的根本所在。

4.2.2 技战术水平的方差分析

如表3所示,在2018年世界杯决赛圈各支球队的技战术指标之间,进球平均、助攻平均、扑救平均、被侵犯平均、越位平均、角球平均等6项指标存在显著性差异和非常显著的差异,说明各队之间能否取得好成绩的主要差异反映在这6项指标上。进球越多球队取胜的可能性就越大,强队队机会的把握更胜一筹。平均助攻次数越多表明球队的技战术丰富,队员之间的配合也更加娴熟。而扑救和被侵犯等防守型指标之间的差异和越位,角球等进攻性指标之间的差异再次表明一支球队想要取得好的成绩,必须在攻防两端都有较好的表现[5-6]。

5 结束语

本文对2018年俄罗斯世界杯决赛圈64场比赛数据进行了多元统计分析,首先采用主成分分析法,将14项比赛因素降维成了5个相互独立的主成分。

对得到的5个主成分进行聚类分析,将32支球队分成四类,第一类和第二类的球队平均进球率均高于平均失球率。而第三类和第四类,平均进球率则低于平均失球率。聚类结果表明具有较高进球率是一支球队立足的根本。而要想取得好成绩则需要攻守平衡,不能存在明显的短板。借用斯皮尔曼相关系数对聚类前后的结果进行了验证,表明聚类结果也与实际情况较为相符。

最后的方差分析的表明,强队与弱队的差距主要集中在进球平均、助攻平均、扑救平均、被侵犯平均、越位平均、角球平均等六项指标。提高进攻效率,大胆运用技术以及加强防守的稳定性是取得好成绩的关键。这表明运用多元统计分析的相关理论方法,研究世界杯数据库的各支球队的数据,能够较为客观的反应出比赛中各队的实际水平,并为球队的发展提供一些有价值的建议[5]。

虽然借助主成分分析和Q型聚类分析可以为球队提供一些有价值的参考数据,但是本文研究仍然存在一定的局限性以及待改进之处,这将是需要我们进一步做的工作。

参考文献(References):

[1] 网易.2018俄罗斯世界杯数据库. http://2018.163.com/

[2] 李峰,张冰,刘璐.基于主成分估计的2014年巴西世界杯足球赛各项技术指标与比赛结果的相关性分析[J]. 西南师范大学学报(自然科学版),2015.40(10):134-139

[3] 侯会生,臧鹤鹏,李凤桥.对第18届世界杯足球赛各队进攻能力的综合评价[J].北京体育大学学报,2008.31(1):138-207

[4] 张冉,张雪临.第16届世界杯足球赛进攻指标的Q型聚类分析[J].中国体育科技,1999.35(11):16-18

[5] 刘天彪,柯洪捷,曹雪薇.基于主成分分析和Q型聚类分析的2011赛季中超足球超级联赛各队的技战术综合分析[J].河北科技师范学院学报,2016.30(1):35-42

[6] 侯会生.第18届世界杯足球赛各队技战术能力的综合评价[J].西安体育学院学报,2007,24(6):77-81

[7] 李猛.第13届亞洲足球俱乐部联赛各球队进攻能力的综合评价[J].辽宁体育科技,2016.38(2):96-99

[8] 王学民.应用多元统计分析[M].第五版.上海:上海财经大学出版社,2017.

[9] 汪冬华,马艳梅.多元统计分析与SPSS应用[M].第二版.上海:华东理工大学出版社,2018.

猜你喜欢
失球进球技战术
644球,梅西打破贝利纪录
2017—2018赛季中超江苏苏宁队失球统计分析
身体素质对篮球技战术发挥的影响
2015年中国职业足球超级联赛山东鲁能队失球特征统计与分析
Goal Trail进球路线 等
2016年欧洲杯足球决赛阶段失球研究
100%的进球率
德约科维奇与费雷尔技战术对比分析
羽毛球男子单打技战术分析
21分每球得分制对羽毛球男子双打技战术的影响