基于深度学习的玻璃基板铲起过程作用力预测

2023-01-05 01:51侯力玮王恒升邹浩然
关键词:作用力基板动力学

侯力玮 王恒升,2† 邹浩然

(1.中南大学机电工程学院,湖南 长沙 410083;2.中南大学高性能复杂制造国家重点实验室,湖南 长沙 410083)

玻璃基板是电子产品显示器最重要的基础材料之一,其减薄工艺是实现玻璃基板更加轻薄和光洁的重要工序[1]。玻璃基板抛磨机是通过化学机械抛光(Chemical Mechanical Polishing,CMP)工艺[2]实现玻璃减薄的工程装备,例如,规格(长×宽)为730 mm×920 mm、厚度为1.0 mm的原料玻璃,通过该工序其最终目标厚度可达(0.40±0.04)mm。在抛磨过程中,玻璃基板处于上定盘和下定盘之间,两盘之间做相对旋转与平移运动,并与覆盖循环的化学抛磨液相互作用,从而实现工艺目标。这种工艺对玻璃基板的夹持要求很高,为防止抛磨过程中对玻璃基板造成划伤、破裂等损害,目前普遍采用一种1 mm左右厚度的聚氨酯发泡垫(称为吸附垫)进行真空吸附。吸附垫粘贴在刚性工作台上,超薄玻璃平放在吸附垫上,通过外力压实,排出吸附垫内微细孔中的空气,使玻璃基板与吸附垫紧密贴合。完成减薄后,需要将玻璃基板与吸附垫分离,实现玻璃基板的卸片操作。

目前,玻璃基板卸片仍主要由人工完成,依赖于人工以手指“抠”的方式向上揭起玻璃,如图1(a)所示。手工卸片方式不仅生产效率低,而且操作过程易造成玻璃基板碎裂。市场对卸片工艺的自动化、精细化操作提出了迫切要求。文中的工程背景如图1(b)所示,目标是用末端安装有六维力传感器的多关节机械臂代替人工来实现玻璃基板与吸附垫的分离,自动完成卸片操作。

图1玻璃基板卸片过程Fig.1 Unloading process of glass substrate

图1 (b)所示的自动化卸片方式是笔者所在课题组提出的一种工艺方案[3],要求:①卸片过程中,铲刀一方面与吸附垫保持一定按压状态,以确保其前端可以进入吸附垫与玻璃基板之间的界面;②另一方面,铲刀需向前推进,其上表面与玻璃基板相对滑动,使玻璃基板与吸附垫分离。这一过程中,铲刀上下表面都发生了复杂的接触力学行为。为避免玻璃基板铲起过程中造成玻璃基板或吸附垫的损坏,同时考虑到现有检测技术难以对两个界面上的接触力进行直接测量,因此只能间接对机器人施加在铲刀上的作用力进行控制。对作用力进行精确控制是实现安全、高效玻璃基板自动化卸片的关键,而准确的作用力预测是精确控制的基础,文中工作就基于这一任务目标展开。

玻璃基板铲起过程中需要施加的作用力受多界面接触动力学的影响,而且与铲刀运动状态直接相关。如果可以利用带有噪声的传感器观测数据、机器人历史与未来运动轨迹对卸片过程中施加在铲刀上的作用力进行预测,就可避免卸片过程造成的对玻璃基板与吸附垫的损坏,进一步地,可以结合模型预测控制[4]等方法对运动轨迹进行优化,提高任务完成的质量与效率。文中主要关注玻璃基板铲起过程中的作用力预测问题。如何基于作用力预测结果对机械臂运动速度进行规划,以缩短操作时间、减少磨损,将作为后续工作进行研究,本文不就此进行讨论。

对机器人操作过程中的接触力行为进行有效建模具有重要意义[5],目前已有大量关于机器人与环境交互时的接触问题的研究,例如对足式机器人行走过程中足底与地面间存在的瞬时法向接触力的分析[6],对机械手抓取物体时的静态法向作用力的计算等[7]。但现有研究大多依赖物理引擎来对接触力进行计算[8],或者仅考虑准静态条件下的受力情况,将方法限制在仅包含刚体运动的理想化场景中,且很少考虑粘性滑移所产生的接触动力学问题。有鉴于此,文中设计了一种可以有效表征接触动力学的深度学习模型结构,并从融合物理先验知识的角度分析了仿真数据采集方法与损失函数设计方法,以期准确预测玻璃基板铲起过程中的作用力。

图2 玻璃基板卸片过程示意图Fig.2 Schematic diagram of the unloading process of glass substrate

1 任务分析

1.1 受力分析

图2描述了玻璃基板自动化卸片过程中铲刀在机械臂带动下的完整运动过程:①从无外力约束的初始点A运动到与吸附垫保持一定按压的位置B;②在保持与吸附垫按压状态的同时,水平向前运动,直至到达与玻璃基板接触的位置C;③继续向前水平运动,直至运动到终点位置D,此过程中玻璃基板边缘被铲起,称为破真空。破真空后整个玻璃基板与吸附垫分离,此过程不在文中讨论范围。

文中主要考虑运动过程③(即从C点运动到D点)的作用力预测问题,此过程中铲刀不仅底面与吸附垫之间存在按压与相对运动,而且上表面也与玻璃基板下表面保持接触状态。这一运动过程包含了来自两个接触界面间的复杂接触行为,不仅影响整个系统的演化过程,也决定了为实现预期操作目标所需要施加的作用力。

为使研究结论具有普遍适用性,文中不考虑机械臂构型的影响,仅对铲刀的受力情况进行分析。玻璃基板铲起过程中铲刀的受力情况如图3所示。根据刚体上力的平移定理,将各矢量力平移到同一点,用Mr表示力平移产生的力偶矩之和。铲刀受到的合力F(t)由以下几部分构成:

式中:FR(t)为机械臂对铲刀的作用力,由于铲刀与机械臂末端的六维力传感器安装在一起,因此FR(t)可以根据力传感器读取,是可观测量,文中需要预测的作用力即为FR(t)在水平与竖直方向的分量;FP为铲刀与吸附垫之间的压力;Ff(t)为铲刀与吸附垫间的摩擦力;FC(t)为铲刀与玻璃基板之间接触力的合力;FG为铲刀的重力。

图3 铲刀受力分析Fig.3 Force analysis of shoveling knife

铲刀在X-Z平面上运动(玻璃基板卸片过程中不考虑铲刀沿Y轴的运动),其位姿可以用(x,z,φ)描述,其中x和z分别代表铲刀相对初始点O沿X轴与Y轴的距离,φ代表铲刀底面与X轴间的夹角。为描述方便,下文用构型q代表铲刀位姿。铲刀运动可以用下式描述:

式中:M(q)为铲刀惯性量;Δt为时间步长,也是下文仿真与实验的采样时间间隔;v与v′分别为铲刀在笛卡尔空间运动时前后两个时刻的速度。

铲刀的状态可以用下式更新:

式中,q与q′分别代表前后两个时刻的铲刀构型。

铲刀与吸附垫间的接触行为取决于Ff和Fp。吸附垫是高分子化合物制成的聚氨酯发泡垫,是典型的弹性体,其与铲刀底面发生相对运动时,会由于弹性体延迟恢复与表面效应而使Ff呈现出很强的非线性[9]。铲刀与吸附垫一直处于接触状态,因此有|Fp|≥0。Fp与铲刀相对吸附垫表面的压入距离r相关,压入距离r满足以下公式:

式中,kp和bp分别为吸附垫的接触刚度和接触阻尼。

铲刀与玻璃基板间的接触力FC(t)由界面水平与竖直两个方向的作用力共同组成。假设铲刀与玻璃基板之间有m个接触点,则有

式中:λN,i和λT,i分别为第i个接触点处的法向脉冲量与切向脉冲量,JN,i(q)和JT,i(q)是与构型相关的接触雅克比矩阵,可以将广义速度映射到第i个接触点法向与切向方向上的欧氏速度。λN,i与λT,i共同决定了接触特性,λN,i阻碍穿透现象的发生,λT,i阻碍铲刀与玻璃表面滑动的发生。尽管使机器人在每个单位时间内维持某一速度v推动铲刀前进,但由于玻璃与金属间的静摩擦系数μs与动摩擦系数μk相差较大,铲刀与玻璃间存在粘-滑运动[10],导致运动过程中λT,i剧烈波动,且满足μkλN,i≤λT,i≤μsλN,i。

通过上述分析可知,作用力FR(t)同时受到多个界面接触动力学的影响,表现出多模态、非线性、非平稳性的特性;而且材料的动力学参数为系统带来了不确定性,各参数的微小变动可能产生截然不同的计算结果。机器人接触问题建模常用的胡克定律建模法[11]或者有限元模型法[12]等都不适用于对作用力FR(t)进行建模。前者依赖于对操作对象的强假设,不适用于文中物理系统涉及的弹性变形以及空间大尺度位移带来的摩擦接触行为;后者仅适合解决静力学问题,不适合处理文中的动态任务。解决此问题的一种可行思路是采用数据驱动的建模方法,将作用力的建模问题转变为机器学习中的回归问题。

1.2 建模思路

将作用力预测模型用参数化隐函数f的形式表示如下:

式中:t代表当前时刻;θ为f的参数;h和H分别为观测时域与预测时域,H=1时为单步预测,H>1时为多步预测。由于铲刀运动过程中沿竖直方向Z与水平方向X的接触动力学特性不同,因此文中将两个方向的作用力预测问题单独考虑。

用图4来表示式(6)所描述的作用力预测模型。模型输入量为过去h个时间步长的铲刀位移q和已采集的传感器读数FR(t-h:t)。机械臂的控制量为运动速度v(t-h:t+H),可以人为设定,也可以利用轨迹规划算法确定。v(t-h:t+H)同样也是作用力预测模型的输入量,但是与铲刀位移和已观测作用力序列的长度不同。在时刻t,需要对未来H个时间步长的作用力进行预测,模型输出为未来H个时间步长的作用力预测值FR(t+1:t+H)。

图4 作用力预测任务示意图Fig.4 Schematic diagram of force prediction task

fθ的建模可以用深度神经网络[13]、高斯过程回归[14]等机器学习模型,将表征接触动力学的差分方程嵌入到端到端的参数模型中。但是纯数据驱动的方法因为不考虑任何有关物理系统特性的先验知识,需要利用大量训练样本才能使模型收敛。除此之外,模型性能也受限于仿真器的准确性,将模型的应用限制在了仿真环境中[15]。

将机理模型与数据驱动模型结合起来有望提高fθ的训练效率。最经典的方法是参数辨识[16],但该方法对机理模型要求很高,玻璃基板铲起过程的力学模型难以准确建立。另外一种经典的方法是用机器学习模型对机理模型进行补偿[17],当机理模型不准确时,此类方法要求采集足够多的实验数据对机理模型进行修正,同样不适合玻璃基板卸片这种对操作安全性要求较高的场景。

上述两种经典方法都采用了以机理建模为主、数据建模为辅的结合方法。反过来,如果将机理建模作为先验知识融合到数据驱动模型的训练过程中,即可实现以数据建模为主、机理建模为辅的结合方法。这种结合方法已被验证可以显著提高数据驱动模型的训练效率[18]。Cranmer等[19]基于能量守恒与动量守恒定律来表示接触动力学,将其建模为拉格朗日动力学方程,然后用深度学习模型对动力学方程中的拉格朗日函数进行参数化学习,这样就构建了包含弱物理先验的神经网络。然而,现有数据模型与机理先验混合驱动的接触动力学表征方法都仅对牛顿刚体系统有效,无法用于文中应用场景。

本研究受文献[19]的启发,同时考虑到在现实世界中直接采集训练数据不仅有限,而且存在损坏工件的危险,因此采用以下思路构建基于深度学习的作用力预测模型:首先利用基于微分物理引擎构建的仿真环境生成足够的训练样本;然后将物理先验知识融入深度学习模型结构设计与模型训练方法中,对预测模型进行预训练;最后将模型部署到实际场景中。与文献[19]不同的是,文中的应用场景包含了更丰富的接触行为,因此将物理信息的演化规律隐式地包含在参数模型结构设计与模型训练的整个流程中。

将机理模型信息作为先验融入到深度学习模型的训练中,其本质是为深度学习设计更强的归纳偏置以提高样本利用效率[20]。为了高效构建作用力预测的深度学习模型,文中采用以下归纳偏置以缩小最优参数的搜索空间,作为模型设计与模型训练的依据:

假设1玻璃基板卸片中的多界面接触动力学行为可以通过捕捉运动与接触动力学演化轨迹的局部特征与长序列特征进行描述。这一归纳偏置在何彦等[21]的研究中得到了体现。

假设2同一系统不同动力学参数所产生的接触动力学在高维空间相对聚集。这一归纳偏置在Peng等[22]的研究中得到了体现。

2 模型结构与训练方法

本节将根据上文提出的归纳偏置分析预测模型的结构与训练方法。

2.1 模型结构

作用力预测属于时间序列建模问题。在时间序列建模中,循环神经网络(Recurrent Neural Network,RNN)模型及其变体——长短期记忆(Long Short-Term Memory,LSTM)网络的应用最为广泛[23]。但是,玻璃基板铲起过程中力传感器的读数存在噪声,而且玻璃基板与吸附垫的动力学参数也存在不确定性,这为上述深度序列模型的训练带来了困难。

为设计一种鲁棒性与表征能力更强的深度学习模型结构,根据假设1,文中以神经网络模型作为基础模型结构,设计了局部特征提取模块、注意力机制模块、时序特征提取模块等模块。

2.1.1 基于多尺度卷积核的局部特征提取模块

一段时间序列数据的不同时间尺度中往往包含不同的信息,例如粘-滑运动中,“粘”行为往往集中在小时间尺度中,“滑”行为则分布在大时间尺度中。因此,文中设计了多尺度的一维卷积神经网络(1D-CNN)来对时间序列数据的局部特征进行提取。卷积层利用卷积核按一定步长对输入序列进行遍历,在遍历的位置上卷积核与输入数据做矩阵乘法运算,再求和:

式中,w为卷积核权重,x(i,j)为起点为(i,j)的卷积区域。

文中设计了3种不同大小的卷积核,尺寸分别为3×2、3×4、3×6,均以步长stride=1遍历输入序列。为了使各卷积核输出序列长度一致,3种卷积核分别取padding为0、1、2。用多尺度卷积核提取输入序列局部特征的数据处理过程如图5所示。

图5 基于多尺度卷积核的局部特征提取Fig.5 Local feature extraction based on multiscale convolution kernel

2.1.2 注意力机制模块

利用局部特征提取模块得到3个序列S1、S2和S3,包含了与接触动力学相关的不同尺度的局部信息,但是需要进一步提取各数据时间维度的信息。由于这3个时间序列对作用力预测的重要程度不同,因此设计了如下注意力机制来对3个序列进行处理:

式中,MLP代表全连接神经网络,softmax代表softmax激活函数。

注意力机制模块的输出根据下式计算:

2.1.3 基于LSTM的时序特征提取模块

在接触动力学建模中,各物理量的时间先后依赖关系起着关键性的作用,因此文中采用LSTM网络作为时间特征提取模块对序列数据进行分析。LSTM网络中包含了1个记忆单元状态st和3个控制门——遗忘门、输入门与输出门。在时间步长为t的时间里记忆单元状态Ct与输出ot的计算公式如下:

式中,f、i、g、C、o依次为遗忘门、输入门、备选更新单元状态、更新后单元状态以及输出门,W与b分别为相应的权重矩阵与偏置向量,tanh为双曲正切激活函数。

经过上述运算得到的特征向量包含了局部与时序的历史信息,但是在预测时域内执行不同运动速度同样会对作用力产生影响,因此,将特征向量与未来时刻的运动速度进行拼接后,才与4层全连接层连接。全连接层的功能是完成回归任务,各全连接层的神经元个数依次为128、64、32、16,激活函数使用ReLu函数。模型整体结构如图6所示。

图6 作用力预测模型的结构Fig.6 Structure of force prediction model

2.2 仿真数据采集策略

深度学习模型的训练依赖大量训练数据,面对安全性要求严格的玻璃基板铲起过程,文中在仿真环境中采集数据用于模型预训练。选取PyBullet[24]作为物理引擎对玻璃基板卸片过程进行仿真,当选取的动力学参数与真实物理系统相符时,可以准确地模拟真实接触行为。考虑到实际工程中玻璃基板、吸附垫的动力学参数与力传感器观测量都存在不确定性,为了使仿真数据能够更真实地反映接触行为,文中采用了下文所述的两种数据采集策略。

2.2.1 动力学参数随机化

在实际玻璃基板卸片过程中,即便采用同一批吸附垫,铲刀与吸附垫之间的接触行为也可能因为吸附垫力学特性的微小改变而不同。同时,玻璃基板减薄效果直接决定了玻璃基板的表面特性,进而影响铲刀与玻璃基板之间的接触行为。为提高作用力预测模型的鲁棒性,文中依据假设2,通过动力学参数随机化方法获取不同接触行为的训练样本,使真实场景下的接触动力学信息总是可以包含在一部分样本中。用Pk={p1,p2,…,pN}k∈RN代表一组动力学参数,N为可变动力学参数的个数,RN为动力学参数空间。通过在动力学参数空间中采样不同的参数组合以构建不同的仿真环境,各动力学参数pi(i=1,2,…,N)都在相应的区间[pilow,pihigh]内均匀采样。文中的可变动力学参数包括玻璃基板表面和吸附垫表面的滑动摩擦系数、接触刚度以及接触阻尼。

2.2.2 作用力补偿

以上仿真环境的搭建都假设所有对象均为刚体,而操作对象玻璃基板自身具有一定弹性,在玻璃基板卸片过程中会发生弯曲;此外,未被铲起部分的玻璃基板与吸附垫之间还存在吸附力。为更加真实地模拟真实场景,还需要考虑上述因素的影响。由图3可知,FC的反作用力F′C作用在玻璃基板上,它不仅产生了使玻璃基板发生弯曲的剪力fbend,也提供了玻璃基板脱附所需的载荷fpeel。

根据悬臂梁的挠曲线公式计算fbend:

式中:φ为脱附角,Lp为已被铲起的玻璃基板长度,这两个量都可以先在仿真环境中观测玻璃基板上接触点的位置,再根据几何知识计算;E为弹性模量,I为抗弯惯性矩。

由于玻璃基板截面为矩形,且厚度为h,宽度为b,有

联立式(17)和(18),有笔者前期研究[25]表明,玻璃基板从吸附垫上脱附的临界脱附力fˉpeel是关于速度、剥离角度的函数。结合实测数据,用二元二次多项式逼近fˉpeel,有[26]

文中假设执行操作任务的机械臂各关节可提供足够大的力矩铲起玻璃基板,因此在任何运行速度下机器人可提供满足临界脱附力fˉpeel的驱动力,故有fpeel≈fˉpeel。

假设铲刀的倾角为α,可以根据式(21)和(22)对仿真环境中采集的FR进行补偿:

2.3 损失函数

损失函数用于衡量模型预测值与真实值之间的偏离程度。作用力预测问题属于回归问题,文中选择均方误差(Mean-Square Error,MSE)作为损失函数:

式中,为模型预测值。

如果FR均为实验采集的数据,则仅利用LMSE就可以训练出一个准确率足够高的模型。但是现有的物理引擎在仿真接触动力学时大多采用的是速度步进的方法[23],需要在每个仿真步长内求解NP难解问题,尽管可以采用凸逼近的方法在有限时间内找到接近真实接触行为的可行解,但其物理准确性难以保证。为了解决该问题,需要将更多先验知识加入损失函数中,对可行解的空间进行约束,引导模型的学习过程收敛到更符合接触动力学的最优参数。

在仿真实验中发现,一些情况下铲刀压入吸附垫的距离r过大,甚至出现不合理的“穿透”现象,因此引入以下损失函数对该现象进行惩罚:

式中,φp,n,i为铲刀压入吸附垫的距离,φlim为允许铲刀压入的极限距离。

因此,建立作用力预测模型的问题就转变为求解以下优化问题:

式中,ε为两个损失函数的权重调节系数。

3 实验与结果

3.1 实验流程描述

为了检验文中方法的有效性,开展了实际玻璃基板卸片任务来对模型的预测性能进行评价。对基于深度学习的作用力预测模型的训练整体划分为两个阶段:基于仿真数据的模型预训练与基于少量实验数据的模型参数微调。整个实验的流程如图7所示。首先在仿真环境中采集训练数据,对模型进行预训练。由于仿真数据与真实情况不可避免地存在误差,因此再用少量实验数据对训练好的模型进行微调。模型微调的具体做法是将特征提取层的参数固定,对回归器进行微调。

图7 实验流程Fig.7 Workflow of experiments

3.2 数据采集与模型训练

共设置1 000组动力学参数来进行仿真实验,每组动力学参数均采样50条轨迹,其中,在不同运动速度v下均采样5条轨迹,v∈{1,2,…,9,10}(单位:mm/s)。单条轨迹采样过程中保持匀速运动。这样,在仿真环境中共得到50000条轨迹。将其中40000条轨迹作为训练集,5000条轨迹作为验证集,剩余的5000条轨迹作为测试集。模型微调采用的实际采集数据为10条轨迹,各轨迹用从1mm/s到10 mm/s的不同匀速运动速度来采集。最后,用另外10条轨迹对最终模型进行评估。轨迹τi均由四元组构成:

式中:(FR(t-h:t),q(t-h:t),v(t-h:t+H))为模型输入,将输入数据均减去均值并除以方差后可得到标准化的数据;FR(t+1:t+H)为模型的输出(标签),即为模型需要预测的作用力。文中轨迹采样频率(力传感器采样频率)为100Hz,考虑到力传感数据中存在较大噪声,将10组力数据进行低通滤波后求平均值,并作为预测模型输入力的单个数据,即预测模型的工作频率为10Hz。

利用PyTorch构建神经网络模型,模型训练运行在两块GTX 1080Ti显卡的服务器上。求解式(25)采用的优化器为Adam,学习率等于0.000 1,所有数据循环迭代训练500轮。文中分别开展了单步预测与多步预测实验。实验设置为h=10、H=1与h=10、H=5,即分别用前10个时间步的数据来预测第11个时间步的作用力、用前10个时间步的数据来预测第11到15个时间步的作用力。

采用平均误差与相关系数作为评价指标,前者可以判断预测结果的偏离情况,后者可以用于检验模型预测作用力与真实作用力走势是否一致。均方根误差RMSE和相关系数Corr的计算公式如下:

式中,y与分别为真实值与预测值,Var(y)和Var()分别为真实值与预测值的方差,Cov(y,y^)为y与的协方差。

3.3 结果与评价

3.3.1 模型训练

图8所示为文中模型在训练过程中作用力的均方根误差随训练轮次的变化(以竖直方向作用力预测为例)。为了分析所提出的考虑物理位置惩罚项的损失函数的有效性,实验中还用仅包含LMSE的损失对模型进行训练,对使用两种不同损失函数时模型训练的效果进行对比。

可以发现,无论是单步预测还是多步预测,仅采用LMSE时模型在训练过程中的性能抖动明显,而同时使用LMSE和LPENE时训练更加平稳,造成这一现象的原因是仅采用LMSE时模型会拟合一些与实际物理情形相悖的仿真数据,而此类数据与真实数据分布之间的差别很大,因此会造成模型训练的不稳定,模型经过500轮训练后仍不能收敛。除此之外还可以发现,相比单步预测,多步预测任务训练过程的波动更加明显,这是由多步预测的误差累积所致。由于文中任务用单步预测结果即可完成操作任务,因此,下文实验分析均针对单步预测的情况来展开。

3.3.2 模型预测能力评价

经基于仿真数据的模型预训练,模型收敛后的RMSE为0.092N。在不经微调的情况下进行单次实验测试,RMSE为3.740N,与仿真结果存在一定的差距。按照3.1节的描述完成微调后进行测试,RMSE为0.902N,可见,文中的微调策略可以有效地将离线训练模型部署到实际场景中。实验测试中一条轨迹的作用力预测结果如图9所示,其中,红色线为经低通滤波处理的传感器读数,绿色线与紫色线分别为单步预测与五步预测的结果。可以发现,文中所提模型的单步预测准确率很高,尤其在预测竖直方向作用力时,预测值与观测值在多处近乎重叠。相比而言,五步预测的结果与观测值存在一定偏差,但是应当注意的是,五步预测结果的走势与观测值基本相同。

图8模型预训练过程中竖直方向作用力均方根误差随训练轮次的变化Fig.8 Variation of RMSE of vertical force with epoch during the model training

图9 中,在大约3.4s的位置处出现了竖直与水平方向作用力的突变,这是因为玻璃基板与吸附垫之间的接触状态发生了改变,原有的吸附状态被破坏。可见,虽然在现有仿真器中难以对真空吸附直接建模,但是利用文中2.2.2节提出的补偿方法可以模拟与实验接近的接触行为。图9中浅蓝色的区域是该运动轨迹下采用不同动力学参数组合的仿真结果所包围的区域。可以发现,观测值几乎总是落在仿真数据包裹的区域内,说明实验中的接触动力学信息基本都包含在基于仿真环境采集的训练集中,这同样证明了在仿真数据采集时作用力补偿操作的可行性,也证明了假设2的合理性。

为验证文中所提模型的优越性,将文中模型与目前作用力预测研究中普遍采用的MLP模型[27]、CNN-LSTM模型[28]进行对比。实验中使MLP模型与文中模型回归器采用相同结构;CNN-LSTM模型仅采用单一尺寸卷积核堆叠,为控制变量,其他设置(包括注意力机制模块)与文中模型保持一致。3种模型的对比结果如表1所示。

图9 作用力预测结果Fig.9 Results of force prediction

表1 不同模型的单步作用力预测性能对比Table 1 Comparison of single-step force prediction performance of different models

从表1可以看出,文中模型的预测性能优于MLP模型与CNN-LSTM模型,其采用的多尺度卷积核可以提取不同层级的局部信息,相比单一尺寸卷积核堆叠的模型在接触动力学表征中有明显优势。

3.3.3 消融实验

为了了解各组件对文中模型性能的影响,验证模型结构的有效性,基于图6所示模型结构开展消融实验,基准网络为全连接神经网络,且与文中模型的回归器采用相同结构。作用力预测模型各部分组件的消融实验结果如表2所示,其中A、B、C分别表示基于多尺度卷积核的局部特征提取模块、注意力机制模块、基于LSTM的时序特征提取模块。

表2 作用力预测模型各组件的有效性分析Table 2 Effectiveness analysis of each component of the force prediction model

对比模型1、2、3、6的结果可以看出,仅采用全连接神经网络时,模型的特征提取能力不足,性能远远低于其他模型。随着依次在基准网络上添加A、B、C模块,无论在仿真还是实验条件下,均方根误差和相关系数两个指标都得到逐步改善,说明文中模型采用的3个模块在提高作用力预测能力上都发挥了相应作用。

对比模型5与模型6的结果可以看出,在缺少基于多尺度卷积核的局部特征提取模块时,模型的均方根误差显著增大。根据多尺度卷积核的结构特点可知,提取历史数据的局部特征对于提高作用力预测准确率至关重要,实验结果也证明了假设1的正确性。除此之外,在仿真环境下,模型5的相关系数与模型6的相差不大,可以认为相关系数主要受注意力机制模块和时序特征提取模块影响;然而在实验环境下,模型5的相关系数与模型6的相差较大,说明传感器测量噪声的存在为时间序列建模造成了困难,局部特征提取模块的存在可有效抑制噪声。

对比模型3与模型4的结果可以看出,在仿真条件下,二者性能差别较小,缺少注意力机制模块时均方根误差指标较差(相差0.021),而缺少时序特征提取模块时相关系数指标较差(相差0.033);在实验条件下,这一差距将被放大,均方根误差和相关系数分别相差0.266和0.120。由实验结果可以看出:基于LSTM的时序特征提取模块可以有效提高模型对作用力趋势的预测。注意力机制模块可以综合提高模型在均方根误差与相关系数两个指标上的性能,其作用原理在于:不同物理量的局部特征信息在时间维度上的权重是不同的。

总而言之,文中模型的优良预测性能是3个组件共同作用的结果:多尺度卷积核最大程度地保留了时间序列数据的局部特征,抑制了测量噪声对时间序列建模的影响;基于LSTM的时序特征提取模块可以使预测值与真实值的趋势保持一致;注意力机制模块起到了衔接前述两个模块的作用,并使前者提取的特征被更好地利用于时序信息提取。

4 结语

接触问题是机器人工程应用中的一个重要问题,接触行为的准确描述对于高精度的机器人操作控制有重要意义。文中以玻璃基板卸片场景为例,提出了一种面向玻璃基板铲起过程的作用力预测方法,可以在仅利用少量实际采集数据的情况下取得良好的预测效果。文中主要贡献在于将具有强大表征能力的深度学习模型与物理先验知识进行结合,提出了一种面向复杂生产作业条件的接触动力学建模策略。物理先验知识不仅可以指导模型结构设计,还可以使仿真数据采集与模型训练过程更加高效。这种以深度学习模型为主,以刚体动力学、材料力学、断裂力学等学科物理先验知识为辅的作用力预测方法,可以被应用到其他涉及接触动力学的应用场景。

猜你喜欢
作用力基板动力学
《空气动力学学报》征稿简则
小天体环的轨道动力学
高密度塑封基板倒装焊回流行为研究
具有Markov切换的非线性随机SIQS传染病模型的动力学行为
ZTA陶瓷基板的材料设计及电学性能研究
首片自主研发8.5代TFT-LCD玻璃基板下线
高反射率LED 陶瓷基板制备及其COB 封装光源光效的研究
高考中微粒间作用力大小与物质性质的考查
化学键与分子间作用力考点精析
用比较法探究作用力与反作用力的关系