基于CKPCA-HOG 特征的游泳运动员头部姿态模拟研究

2021-03-01 05:25付超

通化师范学院学报 2021年2期

付超

游泳运动员在水中头部及身体姿态的变化会产生阻力.其阻力主要为摩擦阻力、粘差阻力和兴波阻力.摩擦阻力是运动员体表与液体接触产生的阻力，是运动员向前行进时切向所产生的反向力.粘差阻力主要取决于运动员体表与液体的接触面积和运动速度.兴波阻力则来源于运动员在水与空气交界处运动产生的波动.为降低阻力的影响，需要对游泳运动员进行头部姿态的特定训练，让运动员保持头肩部尽可能与水面平行，并在呼吸换气过程时保持头部的稳定，从而形成有利于克服阻力干涉条件［1］.但在当前的训练过程中，教练员很难从池上准确观察运动员头部动作是否完善，因此，需要采用更先进的科技方案解决运动员头部姿势的估计问题.

采用流体力学计算和机器学习识别方法，能够有效捕捉流场细节，精准识别游泳运动员头部姿态，同时机器识别具备自动性和重复性，可以减轻教练员的工作量.机器识别的研究大致可以分为两个方向，其一是由外至内（Outside to inside）的场景研究方案，主要是通过在泳池中设置仿生摄像头，进而捕捉游泳运动员行进过程中的力学变化，已有学者进行了相关研究.例如，ZAÏDI H 等采用CFD技术模拟了游泳运动员行进过程中的流体力学表现，并对游泳阻力进行深入分析［2］；NAEMI ROOZBEH 等通过三维模型构建，基于AR 技术对运动员全身姿态进行估计，对于游泳运动员的周边阻力变动进行数值计算［3］；其二则是由内至外（Inside to outside），主要是让运动员佩戴传感器，通过游泳运动员行进过程中的动态记录来估计运动员躯干的受力情况.由于运动精度问题，学者们的研究多为由内至外，缺乏由外至内的研究成果，同时佩戴传感器进行运动，也会加强运动员的行进阻力.鉴于上述研究的情况，该文将基于由外至内研究方向，试图给出精度更高、识别时间更短、整体成本更低的游泳运动员头部姿态估计方案［4］.

1 主要数值方法

1.1 三维人体几何模型

一般而言，布设由外至内的泳池监测方案，至少需要在泳池中布设10 架摄像仪器，如图1（a）所示.将泳池视为一个立方体，则需要8 枚摄像头设置于边角对物体进行三维定位，再于池边的中线设置两架主摄像仪器，以拍摄运动员的姿态［5］，传统方案对摄影的精度要求极大，且后续需要教练员逐个识别图像，对教练员而言工作量较大［6］.而该文的研究目标是判定运动员在水面滑行时的三类头部姿态（高于、平行及低于身体），因此本方案仅仅需要观察运动员身体的情况（无须观测与液体的相对位置），并以运动员轮廓的三维曲线构成完整的封闭曲面，因此只需要保留中线的两架主摄像仪器（采用SONY F3 三维摄影机），如图1（b）所示.

图1 摄像仪器的设置

该文的三维图像构建情况如下：首先参考参加预实验的游泳运动员A 的行进情况，通过三维拍摄，在Pro/E 软件中绘制其身体轮廓的封闭曲面，将上述曲面导入至ANSYS 软件中进行几何拓扑，从而形成三类头部姿态下的人体模型，上述过程自动编码，后续将由计算器全程自动进行.图2 为运动员A 三种头部姿态的身体模型.

图2 游泳运动员A 三种头部姿态的模型

1.2 图像特征描述方法（HOG）

为了有效分析图2 所示的三维图像，需要将图像进行数据编码，以转换为易于计算机理解的数值情况，因此需要采用图像特征描述方法（HOG）.目标分类是对于未知目标的数值转换，采用一组能够代表目标特征的值作为输入，从而由计算机分析该值是否属于靶向目标.其一，HOG 方法属于典型的局部分析方法，通过提取不同图像中区别最大的局部特征，形成易于区分的特征向量，进而将分类问题转变为聚类问题.其二，HOG 方法的主要数学内涵是梯度方向直方图描述子（Descriptors），即将图像的外观进行分割，通过梯度强度或边缘方向的分布进行数值描述，这些描述子也被称为图像的细胞（Cell），计算每个细胞的梯度/边缘方向的直方图，进而将各个直方图进行组合形成最终直方图描述子.第三，HOG 方法的过程如图3 所示，图3（a）为三维构图后的原始图像，图3（b）为分割后的图像细胞，计算机通过计算各个细胞的直方图，敏锐地发现头肩部波动水平最高，从而锁定至图3（c）的情况，最终由该单元所有像素梯度强度值的和进行归一化，得到如图3（d）的HOG 描述子，该描述子是直接能够被计算机所理解的特征向量.

图3 HOG 特征算子

1.3 CKPCA 方法

对于游泳运动中的运动目标，通过三维拍摄和HOG 方法得到该目标的特征向量，由于所获取的特征向量维度较高，过高的维度会影响目标分类的运算速度，因此还需要通过其他方法进行降维，从而在较低的维度间进行分类.PCA 方法是机器学习中的传统降维方法，该方法运算时间极短，精度较高，但PCA 方法仅仅能够解决线性问题，在实时运行过程中，一旦出现非线性目标，就会出现漏判、误判的情况.而KPCA 方法则是针对PCA方法的改进，该方法首先针对特征向量进行线性判定，对于线性不可分的问题进行单独运算，但KPCA 方法所需的运算时间较长，在游泳运动中进行头部姿态矫正，需要即时发现，即时反馈，显然KPCA 方法仍不符合该文的需求.因此该文引入CKPCA 方法实现上述目标，该方法的核心思想是，通过引入核函数，将非线性空间变换至高维线性空间，并在高维空间采取主成分分析法进行数据降维，再进行实时计算.CKPCA 方法也可能因此核函数设置过于复杂而出现计算时间较长的问题，该文借鉴李勇达等的研究［7］，为了降低核矩阵（核函数）的计算复杂性，选择疏散的贪婪矩阵近似（SGA）方法来缩减样本点个数，进而降低核矩阵阶数.

上述方法的对比如表1 所示，从表中可以看出，直接由HOG 提取的特征向量维度极高，而PCA-HOG、KPCA-HOG 和CKPCA-HOG 方法的特征维度均降至20 维，更低的维度对应更短的计算时间.从运算时间来看，基于HOG方法的直接分类时间最慢，为1 700 ms，而CKPCA-HOG 方法最快，仅为80 ms，这说明利用核函数之后，对于线性/非线性问题的直接适配，能够极大地增加运算效率.其次，CKPCAHOG 方法的理论精度区间最小，为［90%，100%］，更小的理论精度曲线代表目标分类准确性更强.

表1 机器学习中目标分类方法的对比

2 实验过程及结果分析

2.1 实验环境

为了验证该文提出的游泳运动员头部姿态分类算法的有效性，在泳池提取相关三维图片后，在计算机上进行深入的分类分项.计算机配置为Intel Corei5-9400F CPU，内存为8 GB，软件在Visual C++ 6.0 开发环境下运行，包括三维图像绘制软件Pro/E，几何拓扑软件ANSYS 和机器学习软件Python.训练过程的图像来自运动员A 的预先实验，包括运动员A游泳行进过程中未分类的图像和由专业教练员手工检测的分类图像.测试图像来源包括两个部分：其一是来自于运动员A 所使用游泳馆相同泳池的训练数据，20 名与运动员A体型相仿的男性运动员在该泳池同时进行1小时训练，泳姿为自由泳，总计得到200 幅三维图像.其二是来自于另一游泳馆（不同于训练泳池）的100 米模拟训练，该测试由软件自动进行拍摄与分类，然后由专业教练员对其中复杂图像或者错误图像进行分析判别.

2.2 训练阶段

训练阶段是为了使得支持向量机能够准确对图像进行分类，甄别运动员头部姿态情况，以及判定运动员头部姿态是否符合标准，因此需要导入一些具备代表性的已分类图像对其进行训练［8］.该文的训练图像均来自游泳运动员A，该运动员为国家一级游泳运动员，主攻400 米自由泳项目，体态匀称，头肩部控制较好.在预实验过程中，该运动员按照实验目标分别示范了头部平行于身体的正样本，总计40 幅；示范了头部高于/低于身体的负样本，总计40 幅；此外，还加入了部分完全不符合目标参数的负样本，包括完全任意的网络图片、仅拍摄泳线的泳池图片、设置漂浮物（游泳圈、游泳板）的泳池图片、运动员站立于池中的泳池图片等，总计40 幅.将上述120幅图片大小均调整为N×N，以保持信息量的统一性，然后计算得到各个图像的CKPCAHOG 特征，再采用支持向量机进行训练分类，从而获得能够自动识别的模型.

2.3 识别阶段

识别阶段，首先导入训练好的CKPCA-HOG支持向量机分类模型.再通过摄影机的实时拍摄，将相关特征数据录入计算机进行分析.该文主要考察了两个场景的识别情况，第一个场景是训练阶段相同泳池的识别情况，由20 个志愿参与本实验的游泳运动员进行，主要进行100 米自由泳训练，摄影机针对泳池情况进行随机录入，最终得到200 幅三维图像，分类情况如表2 所示.对于待分类的200 幅三维图像而言，训练好的机器识别分类器成功识别197 组，漏检1 组，错检2 组，实际精度为98.5%，处于理论检测精度区间，检测精度较高.

表2 相同场景的识别情况

第二个场景则是不同于训练阶段的泳池，且由机器直接分类提交池内运动员的正确头部姿态情况.该文在专业游泳队举行的100 米自由泳训练中进行分析，在场馆内布设监测设备，并实时进行姿态估计和拍摄，由专业教练员对比判定机器分类结果是否正确，训练中总计8 名运动员，监测情况如表3 所示.分类器最终提交图像中捕捉到8 名运动员信息，捕捉率100%；提交正确头部姿态176幅，经教练员判定，174 幅符合正确头部姿态标准，判定率98.86%；提交错误头部姿态212幅，经教练员判定，211 幅符合错误头部姿态标准，判定率99.52%.

表3 不同场景的识别情况

3 结论

研究基于由外至内的场景研究方案，目标是尽可能实现减少泳池内运动传感器数量的同时，提高识别精度.对此，该文在泳池内布设两架三维摄影机（型号：SONY F3），对运动员进行姿态捕捉，并采用Pro/E 软件生成运动员三维模型，再以CKPCA-HOG 模型进行机器识别，从而对游泳运动员的头部姿态进行估计.对于待分类的200 幅三维图像而言，训练好的机器识别分类器成功识别197 组，漏检1 组，错检2 组，检测率为98.5%；在模拟100 米训练过程中，识别器总计捕捉8 个运动员信息，捕捉率100%，识别176 组头部姿态正确（平行于身体）的三维图像，经专业教练员对比判定，成功监测174 组，判定率为98.86%；识别212 幅头部姿态错误（高/低于身体）的三维图像，经专业教练员对比判定，成功监测211 组，判定率为99.52%.总的来看，该文所构造的CKPCA-HOG 游泳运动员头部姿态估计方案，具备下述三个优点.

第一，成本低廉，对摄影机要求较低.传统的游泳姿态估计过程，最少需要在泳池（视为立方体）的8 个角及4 个边的中心点设置监测仪器，而该文仅仅在2 两个中心点设置三维摄影机，相比之下成本需求更低.

第二，识别精度高，用时短.对于转瞬即逝的游泳行进而言，实现尽可能低的识别时间，是方案可大规模应用的前提，该文的检测方案，相比于传统识别方案所需时间更少，识别精度更高，因此有利于大规模应用.

第三，针对头部姿态的特定检测，有助于改善运动员游泳姿态，减少兴波阻力，进而提升运动成绩.该文的监测方案之所以能够实现短时间、高精度的监测，就是因为利用HOG方法将监控范围锁定在运动员的头肩部，进而采用CKPCA 模型对三类姿态进行快速识别，路径更明晰.在未来的实践过程中，还可以将监测范围进行移动，例如针对游泳运动员腿部、髋部、臀部等特定位置进行姿态监控，进行针对性地运动姿态调整.