基于遗传算法优化的单球移动机器人原点自平衡控制

2019-07-08 08:49刘飞飞朱杨林
制造业自动化 2019年6期
关键词:单球最优控制移动机器人

刘飞飞,朱杨林

(江西理工大学 电气工程与自动化学院,赣州 341000)

0 引言

与传统移动机器人相比,动态自平衡机器人是一种多变量、高阶次、强耦合,欠驱动的非线性系统,具备更快速、灵活的运行能力[1~7]。

如图1所示,单球移动机器人由圆柱形载物主架体和驱动球组成,利用三个全向轮实时驱动球来保持机器人的平衡。对其研究最早可追溯到2005年,美国Lauwers等人设计的“Ballbot”机器人[2],但由于结构的限制,无法实现自转。后来,日本Kumagai等人进行不断改进先后设计了球上平衡机器人“BallIP1”[3],“BallIP2”[4]和“BallIP-W”[5],采用PID算法实现控制,虽实现了快速调整,但抗干扰能力弱。研究较为成功的是使用了LQR算法的“Rezero”机器人[6]和“Ball-Riding”机器人[1]不仅能实现动态平衡,而且具有较好的灵活性。但针对机器人的原点自平衡控制问题,没有考虑姿态平衡和原点控制的权重分配,影响了整个系统的调节时间。

本文为进一步提高机器人的原点自平衡能力,提出一种基于遗传算法优化的自平衡控制方法,采用遗传算法来优化LQR控制器中的权重矩阵,平衡控制输入与各被控状态的权重关系,实现最优控制。首先,将机器人简化为二维的单球倒立摆模型,建立Eular-Lagrange动力学模型;其次,对全向轮和驱动球进行力学分析,找出全向轮与驱动球的移动规律;接着,基于遗传算法的LQR控制方法设计自平衡控制器,对被控状态进行归一化,使单球移动机器人各状态以统一的量纲表示,以归一化后的二次型性能指标为寻优标准,采用遗传算法对权值矩阵Q进行优化。最后,通过仿真对比验证所设计控制器的有效性。

图1 单球移动机器人实物图

1 模型建立

1.1 动力学建模

将单球移动机器人简化为二维的倒立摆如图2所示,以驱动球心O为原点建立空间直角坐标系O-XYZ,在XOZ和YOZ平面分别建立两个解耦的动力学模型。在建模中作如下假设:1)机器人主架体和驱动球都视为刚体;2)各部分的摩擦力(力矩)与相对速度(角速度)成正比;3)球体与全向轮、地面之间做纯滚运动;4)XOZ和YOZ平面的两个模型运动分析是可分离的,且运动方程相同,只有方向上的差别,故建模与控制器设计中只作XOZ的分析。

图2 单球移动机器人简图

图3 全向轮与驱动球的位置关系

表1 单球移动机器人物体参数表

模型中以θx、φx作为广义坐标,分别为在XOZ平面上主架体的倾角位移和驱动球的角位移,τθ和τφ为对应的广义力矩。机器人的具体参数如表1所示。参照文献[8]中太阳与地球相对位置得θ+ψ=90°,并建立Eular-Lagrange方程[7]:

其中,Mi(qi)为惯性矩阵,Ci(qi,qi)为离心力和科氏矢量,Gi(qi)为重力矢量,Di(qi)为耗散能;由式(1)可得:

由向量混合积的轮换对称性得:

由式(7)和式(8)得驱动球X方向的速度与三个全向轮角速度的关系,求导可得:

将式(2)将线性化得机器人X方向动力学方程:

1.2 移动规律分析与运动转化

单球移动机器人控制系统相似于倒立摆,但又区别于倒立摆,其平衡控制主要由三个全向轮实时灵活地进行启停、方向和转速控制。图3中A、B、C分别为相切于球面的全向轮,在不考虑全向轮速度大小情况下,以他们方向作为控制对象可分为八种情况分析。本节以全向轮A、B、C分别按顺时针、逆时针和逆时针情况进行分析,其他以此类推。假设机器人对球体受力均匀,并规定计算过程中负号“-”代表全向轮顺时针,正号“+”为全向轮逆时针。为全向轮对球体的静压力,大小相等,方向都指向圆心。别为对应的力矩。分别代表坐标X、Y、Z正方向上的单位矢量,驱动球转动的方向以图3(b)作为分析,静压力的合力及对球心的合力矩分别为:

由此可知,在该情况下球体向0°方向转,即绕着X轴正转。用相同的办法,改变全向轮速度或方向,可分别获取驱动球向不同方向的运动。表2为全向轮不同状态下驱动球的转动状态。横轴代表三个全向轮的方向,纵轴代表驱动球在全向轮不同速度和方向下转向,单位为度。

忽略驱动球绕Z轴自转现象,根据文献[7],全向轮线速度与驱动球相对地面速度的运动转化公式为:

2 自平衡控制器的设计与仿真

为使单球移动机器人能更好的达到原地自平衡状态,设计了如图4所示的自平衡控制系统。初始指令分别为单球移动机器人在XOZ平面和YOZ平面的倾角、位移及相应速度。在两个平面上分别设计了两个独立的基于遗传算法的最优控制器1和控制器2,输入为初始指令与反馈信息的差值,输出为X、Y方向机器人的加速度ux、uy,通过积分、运动转化,将驱动球速度转化为三个全向轮的速度,最后输出电机执行指令使机器人迅速达到原地自平衡状态。

表2 驱动球在XOY平面的转向

图4 自平衡控制系统框图

2.1 线性二次最优控制器

线性二次型最优控制是一种特殊的最优控制方法,以二次型函数的积分为性能指标泛函,不仅同时兼顾系统性能和能量消耗,而且具有较好的鲁棒性[9,10]。通过式(10)分析计算机器人线性化状态空间模型为:

经Matlab软件编程验证该系统可控但不稳定。设计二次型指标函数:

当系统因外界干扰而偏离原点自平衡状态时,通过施加的ux使系统回到零点附近,同时使二次型指标函数达到最小,其规律满足:

K为线性最优反馈增益矩阵,可通过Matlab软件中的[K]=lqr(A,B,C,D)函数获得。其中,权值矩阵Q、R用来平衡状态向量和输入向量的权重,其值直接决定了控制器的性能[11,12]。一般情况下,权重矩阵Q和R由工程人员根据经验主观臆断决定,而针对强耦合、多变量的单球移动机器人系统,通过试凑法寻求系统的最优控制器,使各输出变量的超调量、调整时间达到最优化目标,并非易事,故本文提出采用一种遗传算法来优化控制器中的权值矩阵来优化控制器的性能[13]。

2.2 基于遗传算法的线性二次最优控制器

遗传算法[14]是模拟自然界生物进化机制的一种算法,以要寻优的参数组成染色体,通过选择、交叉,变异等操作,并行式地搜索使得种群朝着最优的方向进化,最终获得最优解。具体流程如图5所示。

图5 遗传算法操作流程

本文利用遗传算法优化控制器中的权值矩阵,使被控状态的超调量,调整时间及输入变量达到最优。为提高编码效率,根据经验取R=1,以矩阵Q中的对角元素q1、q2、q3和q4作为寻优参数组成染色体。在控制系统中,相对于原点控制,姿态的平衡控制更为重要,因此倾角(x1)所对应的Q中的元素值>位移(x3)所对应的Q中元素值。在平衡点附近时,机器人及驱动球的角速度均很小,对目标函数的影响也很小,因此q2和q4可以取较小值,据此对参数进行二进制编码,即q1∈[0 210]、q2∈[027]、q3∈[029]、q4∈[027]。目标函数的计算和适应值的选取是遗传算法的核心,以被控系统归一化的二次型性能指标作为遗传算法目标函数,将各输出变量归一化,公式如下:

性能指标归一化之后,整体参数不会一味朝着取值小的方向搜索,而是侧重于各变量重要性分配,从总体的角度出发考虑系统的稳定性,避免了算法的偏向搜索。以a=0.005s为一个时间单位,n为时间积分次数,对目标函数进行积分计算:

考虑到目标函数值积分后所获得值过大而影响最终结果,调整适应度函数为:

2.3 仿真结果与分析

本文设计的控制器用于机器人原点自平衡控制,其对控制时间具有较高要求,其次是机器人的抗干扰能力。因此,本文以调节时间和系统的抗干扰能力作为主要评估指标。分别对比采用人工整定法及遗传算法优化情况下,控制器对机器人倾角、位移的控制能力。

设状态变量初始值x0=[0.05 0.01 0 0]T;遗传算法中参数:种群50,染色体长度34,交叉概率0.7,变异概率0.005,经过100次迭代后,权重矩阵:

相应的反馈增益阵:

取一组人工整定的权值矩阵:

相应的反馈增益阵:

由图6和图7可知:当机器人偏离平衡点以0.01m/s角速度向X正方向倾斜0.05rad时,控制器立即给出加速度命令,控制全向轮转动,随着机器人身体姿态逐渐平衡,加速度变小,经过3s,机器人的,,x及都基本为零。表3和表4分别为基于遗传算法优化和人工整定的各状态调节时间ts和超调量mp,从表中数据看,无论从哪方面,经过遗传算法优化的控制器都较优。

在第6s和14s,对优化前后的控制器添加1m/s2的脉冲干扰,从图8个状态响应过程可知,优化后的控制器对脉冲干扰的响应更快,抗干扰性更强。

综上所述,遗传算法优化后的控制器可以使机器人更快地达到稳定,且鲁棒性好,更适用于单球移动机器人的实时控制。

表3 遗传算法优化后的控制参数

表4 人工整定后的控制参数

图6 单球移动机器人的姿态和位置

图7 单球移动机器人的控制输入

图8 单球移动机器人的在干扰下的姿态和位置

图9 单球移动机器人的控制输入

图10 适应值的迭代变化

3 结论

1)相比使用人工整定单球移动机器人最优控制器的权重矩阵,使用遗传算法可以更方便、更准确地对控制器参数进行优化整定。

2)使用遗传算法进行最优控制的参数优化后的控制器可以更快地实现平衡,更适用于单球移动机器人的站立平衡控制。

3)使用遗传算法进行最优控制的参数优化后的控制器的抗干扰能力更强,鲁棒性更好。

猜你喜欢
单球最优控制移动机器人
移动机器人自主动态避障方法
基于增益调度与光滑切换的倾转旋翼机最优控制
移动机器人路径规划算法综述
二阶微分方程最优反馈控制
浅谈大学初级乒乓球课程教学中的多球练习法
基于四元数卷积神经网络的移动机器人闭环检测
基于改进强化学习的移动机器人路径规划方法
基于随机最优控制的缴费确定型养老基金资产配置策略
浅谈排球教学中单球训练方法
“单球+多球”教学模式在乒乓球普修课教学中的实验