基于深度学习算法的篮球运动技术特征目标检测与精细定位

2021-12-08 04:14
关键词:篮球运动卷积篮球

罗 丹

(龙岩学院 体育与健康学院,福建 龙岩 364012)

现代篮球运动已经不仅仅是运动员之间的竞赛,它已经逐渐成为各个国家技术发展的综合竞争.篮球赛事中各项记录的突破,不仅是人类突破生理极限的体现,也是体育技术创新的体现[1-2].因此,与体育科学交叉的学科越来越受到篮球运动员、裁判员、教练员的重视,主要包括生物力学、心理生理学、运动医学和计算机科学等.其中在计算机科学方面,为了提高篮球运动训练中的科学技术分析能力,需要自动获取篮球运动员训练过程中的各种技术参数[3-4].

传统技术参数的获取方法是在篮球运动员身上添加传感器,但该方法的缺点是可能会影响篮球运动员的比赛成绩[5].而篮球赛事的录播影像通常有一个统一的拍摄模式,其保真度和实时交互性为获取运动员的技术参数提供了强有力的支持,这样既能使篮球运动员和教练员达到直观教学和快速反馈的目的,又能大大降低运动员受伤的可能性[6].因此,各种体育动作识别跟踪技术已经被用来提取这些影像中的技术动作,以此实现人机交互,为进一步提升运动员的技能并保护其免受运动伤害带来了巨大的成效[7-8].

JI等[7]开发了一种用于人类行为识别的3D卷积神经网络(Convolutional neural network, CNN)架构,在查看动作影像时,计算机实时捕捉人体运动轨迹和运动趋势,以确定人体部位的位置和形态,然后通过计算机分析动作的技术特征,并将分析结果报告给教练或运动员.李睿敏[5]提出了一种基于深度残差网络和实例搜索的渐进式动作检测算法,重点实现了运动员动作的高精度精细定位.Ellis等[8]采用前一图像中包含的所有关节之间的距离信息,和当前图像中每个关节点与参考动作对应关节点的距离信息,来描述运动员的偏移特征、姿态特征和运动特征的信息.梅齐昌等[9]通过深度学习算法模型研究了远动员在长距离跑步时,后下肢关节的负荷与跑步的脚步姿态的变化,并分析了运动员膝关节接触力的分布情况,提出了针对降低膝关节损伤的科学跑步训练方法.由此可以看出,随着机器学习技术的快速发展,人们对自动识别和监控各种运动影像对象的需求不断增加,以此实现运动数据的统计,为运动员后期技能的提升带来更加科学的训练方法.

然而,由于运动影像的高度复杂性和非线性特性,在复杂场景或景深变化较大的情况下,会降低关键帧提取的准确性,容易造成人体运动识别错误,导致目前还没有一种公认的通用图像算法,来实现对篮球动作在时间上的目标检测与精细定位.因此,本文针对篮球运动中动作评估自动化的需求,开发了一套视觉动作追踪识别与目标检测模型,应用卷积神经网络实现篮球影响的逐帧分类,采用边界定位算法准确提取与视频相关的篮球动作,用于同步记录篮球运动员在赛场上的动作数据,以此来搭建篮球打法精细评估数据库,设计得分评估算法,实现了精细动作的自动评估,为篮球运动员的技术提升提供新的技术服务平台.

1 研究方法

国际篮球大赛或者高水平篮球对抗赛NBA等通常有一个相对统一的拍摄模式系统,很容易提供一些篮球赛事的图像语义.根据文献[10]中提供的异构多处理器分析方法,本文基于CNN异构多处理器篮球运动图像检测的分析流程,如图1所示,采用篮球运动中最重要的3个动作:篮板站位、投篮、传球来进行目标检测与精细定位评估.首先应用卷积神经网络实现篮球影响的逐帧分类,保持已有的卷积神经网络模型的全连接层之前的层的结构和参数不变,将最后一个全连接层的节点数设置为图像类别数,使用迁移学习在 Imgae Net上预训练全连接层的参数,实现端到端的逐帧图像分类,其网络结构如图2所示.其中CNN的输入是影像帧,输出是4维向量

O=[o1,o2,o3,o4].

这3类动作的评估任务与目前大多数动作的评估算法区别较大,更多的是手臂的精细动作,尤其是手与篮球的交互动作,技巧性较强.因此,现有的动作评估方法用于评估此类精细动作较为困难.为了充分利用人体在运动过程中的活动动态,需要进行图像的边缘降噪预处理,此时原始图像通过自适应时域滤波器被激活,时域滤波是从原始图像中减去模糊图像,利用锐利边缘公式对图像进行处理,得到锐利的图像.

F(x,y)=2f(x,y)-f′(x,y),

(1)

其中:f(x,y)为原始图像;f′(x,y)为模糊图像.

图1 CNN精细动作评估流程

图2 用于图像分类的CNN结构示意图

尽管时域滤波提高了图像序列分类的准确率,但少量分类错误的影像帧仍然存在,这会导致找到错误的边界,因此为了准确提取与视频相关的篮球动作识别的高级特征,采用如图3所示的边界定位算法对模型进行了改进,以适应视频数据,获得更高的精度.

图3 边界定位算法

影像数据库中共有20位国际顶级篮球运动员的比赛影像,每位运动员的篮球动作数据大约包含18 000张图像,每个帧的大小调整为64×48,然后帧被输入到设计的架构中进行特征提取.为了训练网络的参数,本文利用随机梯度下降算法,将初始学习率设为0.1,经过10 000次迭代,学习率变为0.001,设置动量为0.9,重量衰减为0.000 2.本文训练模型,直到训练损失覆盖.选用Res Net-50作为CNN模型的逐帧图像分类模型,所有实验均在具有NVIDIA Quadro K5300图像处理器的Intel®Xeon(R),32GB RAM计算机上建立.

2 结果与讨论

本文目标检测系统对篮球运动员运动识别结果和预测结果见表1.预测的准确性是指预测一个运动员的移动动作与真实值(Ground truth)相同的比率.从表1可以看出,本文方法对投篮动作的识别和预测精度达到85%以上.但是对篮板和传球识别预测的准确率较低.测试集上的识别精度和预测精度略低于有效集,说明通过更显著的训练实例可以进一步提高本文目标检测系统模型的性能.

针对特定的篮球运动,基于人体关键点重构目标检测系统中相应的动作——篮板、投篮、传球.本文提出的方法可以在一定程度上帮助篮球运动员更好地适应各种训练方法、战术训练,快速提高运动员的成绩.分别对篮板、投篮、传球和精细运动评估中的目标检测系统自动评分(本文提出的算法)和传统人工评分进行线性回归分析,以研究其相关性,如图4所示.图4中每个点代表一次测试的结果,横坐标表示自动评估算法得到的评估分数,纵坐标表示传统训练方法评估的真实值,从图4可以看出,自动评估算法和传统的训练方法评分成线性关系.与传统的训练方法相比,本文目标检测系统得到的精细动作(图4d)具有一定的优势,能够带来更好的教学效果.这种讲解与演示的结合,可以极大地刺激运动员的感官,使其有更深的记忆,对技术有更深的理解.

表1 篮球运动员运动的识别结果与预测结果比较

(a)篮板;(b)投篮;(c)传球;(d)精细动作 图4 目标检测系统自动评分和传统人工评分的相关性分析

此外,传统的模型一般无法恢复篮球运动的一些手臂姿势特征,如严重遮挡、高移动速度、突然的方向变化、球员之间大量的身体对抗,这些特征对个体球员和团队的检测效率的准确性提出了挑战.因此,本文提出的目标检测与精细定位方法在对球员进行检测后,对被检测球员所在区域进行裁剪,并通过对手臂姿势特征的统计划分出五个运动通道来表征手臂姿势分布的特征,以识别篮球打法的隶属关系,以此获得更为精细的检测与精细定位方法.由于获得了统一手臂姿势的先验条件,本方法无需在数据集构建时进行额外标注,即可对篮球打法隶属关系进行分类,可以更精确的识别出篮球远动员的技术技巧.与积分通道特征(Integral channel features,ICF)[11]、快速递归卷积神经网络(Faster Recurrent Convolution Neural Network,RCNN)[12]、单激发多盒探测器(Single Shot Multibox Detector,SSD 512)[13]模型中检测的准确率进行了比较,其结果如图5所示.可以看到,本文方法在所有算法中精确率最高,达到了95.6%,这表明本文设计的目标检测系统是有效的.

图5 本文方法与其他方法比较

3 结论

本研究采用深度卷积神经网络方法进行目标识别,提取运动员动作姿势行为数据,对3种篮球运动中的篮板、投篮、传球复杂技术动作行为进行了跟踪研究.结合CNN图像提取和动作识别算法的特点,通过与3种经典分类算法的比较,表明该识别方法是可行的.且研究发现,深度卷积神经网络的高难度动作识别可以提高目标识别的准确率,可以达到95.6%,并能充分发挥其作用.这些特点促进了高难度技术动作的训练应用,避免了运动损伤,为更好地提升篮球运动员的动作技巧提供理论支持.

猜你喜欢
篮球运动卷积篮球
幼儿篮球运动
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
国际篮球运动研究热点与主题演化内容分析
从滤波器理解卷积
快乐篮球进山乡
鞍山市第五中学篮球运动开展现状调查与发展对策研究
篮球36计之瞒天过海
基于傅里叶域卷积表示的目标跟踪算法
篮球辉煌(中篇小说)