基于自抗扰控制的地铁列车驾驶控制算法

2020-05-18 10:41戴胜华郑子缘

铁道标准设计 2020年5期

戴胜华,郑子缘

(北京交通大学电子信息工程学院,北京 100044)

随着我国城镇化率的不断上升，现代大都市人口愈发稠密，城市交通问题日益严峻，建设高效率、高密度、高可靠性的城市轨道交通体系成为迫切需求。为了满足这些要求，列车自动驾驶(automatic train operation， ATO)是必不可少的。采用优秀的列车驾驶控制算法，可以有效提高行车的安全、改善效率、提高密度、增加旅客的舒适度，减少司机人控不确定性，降低司机劳动强度。

比例积分微分(proportion integration differentiation， PID)控制算法是一种经典的控制算法，已经被广泛运用于地铁列车控制中，并取得了一定的控制效果。然而在地铁列车运行过程中运行参数以及各种干扰存在较大随机性，基于PID算法的列车控制器不能很好适应这种干扰，使得在实际控车中，列车行驶策略常常会出现频繁的调整，加减速切换次数过多且超调问题严重，列车难以平稳运行，旅客乘坐时非舒适度很高。面对这种问题，应当使用一种对外界干扰具有很强抑制能力的控制算法，使得列车准确的运行于ATO设定的位置-速度曲线之上。

文献[1]介绍了现有自动驾驶系统控制算法及其各自的优劣。文献[2]给出通过经典的PID算法对列车控制的实验结果，文献[3]提出一种模糊PID列车控制算法，文献[4-5]研究了基于专家经验的列车控制系统，文献[6-7]使用自抗扰控制算法，解决了PID算法固有的超调大，控制不精确的问题。文献[7]研究了基于自抗扰控制(active disturbance rejection control， ADRC)算法的磁悬浮列车控制，文献[2，8]给出了轨道列车的精确数学模型。本文在文献[2，3-4，8]的基础上，考虑到ADRC控制算法既具有PID算法的优势，又对被控对象的数学模型几乎没有任何要求，还引入了基于现代控制理论的状态观测器技术，并将抗干扰技术融入了控制系统当中，且ADRC控制算法可以利用改进的粒子群算法快速整定控制参数。故将ADRC控制算法运用于地铁列车自动驾驶控制，并进行MATLAB仿真实验。相较于文献[8]，本文同时比较了PID控制算法，模糊PID控制算法，专家系统，ADRC控制算法四者对北京地铁亦庄线宋家庄站到肖村站ATO距离-速度运行曲线的跟踪情况。记录并分析了这4种控制算法的速度误差，加速度，加速度变化率的原始数据。量化了列车非舒适度指标、能耗指标、停站精度、运行时间误差指标，并进行对比。

1 列车控制模型

1.1 地铁列车运行约束方程

地铁列车运行过程的运动学关系[9]可描述为

(1)

式中，s(t)，v(t)，a(t)分别表示地铁列车行驶距离、行驶时的速度和加速度。u(t)为列车的加速度变化率。地铁列车在实际运营的时候会受到时刻表、线路以及列车自身特性等多方面约束。

为了保证地铁列车的安全运行，站间行驶速度不应超过限速值vlimit，因此可以得到关于列车速度的不等式约束

0≤v(t)≤vlimit

(2)

根据列车本身的牵引/制动特性，将其所能达到的最大加/减速度设为alimit，则列车行驶过程中的加速度需满足

-alimit≤a(t)≤alimit

(3)

由于列车加速度变化率太大会造成较大的冲击，影响乘客的乘坐舒适性，因此对加速度变化率进行上下界约束

-arate≤u(t)≤arate

(4)

式中，arate为最大加/减速度变化率。

1.2 地铁列车数学模型

在文献[3，8]研究的基础上，针对受控列车对象建立精确的数学模型[10]，选用合适的传递函数G(s)，如公式(5)所示。在该列车模型的基础上，所选列车电机模型恒力区范围0～40 km/h，恒功区范围40～55 km/h，自然特性区范围为55～80 km/h。

(5)

图1为地铁列车的控制模型，目标跟踪ATO曲线和输出信号的差即误差信号被输入到速度控制器，由速度控制器控制牵引力/制动力，从而控制机车，得到机车的速度-距离曲线输出。

图1 实际地铁列车控制模型

1.3 线路数据

根据资料，地铁列车从宋家庄站行驶到肖村站的距离S=2 632 m，站间限速如表1所示。地铁列车在恒力区下的加速度限制alimit1=1.1 m/s2。在恒功区下的加速度限制alimit2=0.22-1.1 m/s2，具体数值可由电机功率除以列车质量与速度的乘积获得。在自然特性区下的加速度限制alimit3=0.22 m/s2。最大制动加速度abrake=1.3 m/s2，允许的最大加/减速度变化率arate=0.75 m/s3。牵引切除延时为6 s，制动的施加延时为1.2 s。由上述条件，可以通过MATLAB仿真[11]得出如图2所示的限速曲线、ATP限速曲线以及ATO运行曲线[12]。为模拟计算方便，假定线路限速曲线可与ATP限速曲线重叠。而实际设计中，轨道弯道段的线路限速曲线与ATP限速曲线间须有一定裕量，以保证列车瞬时顶棚速度不会大于线路限速。

表1 宋家庄站至肖村站线路限速情况

图2 ATP限速曲线与ATO运行曲线

1.4 优化指标

1.4.1 舒适度

列车的加速度和加速度的变化率等条件决定了旅客的舒适度[13-14]。根据国际标准ISO2631中给出的舒适度的评价标准，参考该指标的推荐，以式(6)衡量列车非舒适度。

(6)

式中，J为非舒适度的值；a为列车运行的加速度值；t为列车运行时间。

1.4.2 能量消耗

为了比较各ATO控制算法的能量消耗优劣，通过微分的能量计算公式，用每一个瞬时作用在列车上的力和列车行驶距离的乘积的累加和，来表征列车总的牵引制动能量消耗[15-17]

(7)

式中，E为列车运行能耗；m为列车质量；ai-1为i-1时刻列车的运行加速度；Si，Si-1分别为i，i-1时刻的列车运行位移；由于下文中的控制算法针对同一个控制模型，其列车质量相同，故把能耗指标简化为

(8)

1.4.3 停车精度

停车精度指列车到站后，实际停车位置和严格按照ATO目标曲线运行时的理论停车位置的差[18]，通常可表达为

ΔS=|S-S0|

(9)

式中，ΔS表示停车精度；S为实际停车位置；S0为理论停车位置。

1.4.4 运行时间误差

理论运行时间指列车在一段线路上严格按照ATO目标速度曲线运行所消耗的时间，通常可由式(10)所示的积分形式表达。

(10)

式中，T0为理论运行时间；x为理论运行距离；t(x)为经过dx距离所用的时间。

运行时间误差指当前列车运行的实际时间和理论运行时间的差值，由式(11)所示的公式表示

ΔT=|T-T0|

(11)

式中，ΔT表示运行时间误差；T为实际运行时间；T0为理论运行时间。

2 ATO控制算法

2.1 PID控制算法

现有地铁列车自动驾驶系统大部分采用PID控制算法[19]。PID是一种线性调节系统，该系统将输入的设定值与前一时刻的输出值的偏差按比例、积分和微分对模型进行控制。这种控制方法需要事先给定好的ATO距离-速度曲线作为输入。其缺点是控制速度时的加减速切换次数过多，不利于列车平稳运行，旅客舒适性一般，能耗略高，停车精度有限，运行时间误差较大。PID控制器的输出如下

u(k)=Kpe(k)+

(12)

式中，Kp、Ki、Kd分别为控制器的比例、积分和微分系数，它们通过大量的实验反复调试后选定；e(k)和e(k-1)为第k次采样和第k-1次采样时的误差反馈；u(k)为第k次采样时控制器的输出；对于PID控制模型，输入的ATO距离-速度曲线值减去前一时刻输出信号得到速度响应误差，速度响应误差输入PID控制器后，得到了对被控对象的控制输出。

2.2 模糊PID算法

地铁列车运行过程中受到很多不确定因素影响，属于复杂动力学过程，在不同的条件下，最佳控制策略有很大差异，这使得经典的固定参数的PID调节方式难以胜任。因此，需要对PID控制参数进行模糊化自适应[20]，实时调整微分系数、积分系数以及比例系数，找到它们的最佳组合，以较好满足控制要求。模糊PID控制算法[21]就是这样一类能进行参数自适应的PID算法。由模糊逻辑进行整定的PID控制器的表达式为

(13)

式中，γp(k)，γi(k)，γd(k)为校正速度量，它们的取值将随着校正次数的增加而逐渐减少，将式(13)代入式(12)，即可计算模糊PID算法的控制量。对于模糊PID控制算法，输入的设定值与前一时刻的输出值的偏差，按比例、积分和微分对模型进行控制。且该偏差及其导数将通过事先训练好的模糊网络[3]，实时动态的调节PID控制参数，以提高PID控制器的控制效果。

2.3 基于专家经验的智能控制算法

本文中的专家系统主要指的是一个智能计算机程序系统，其内部含有大量的地铁亦庄线有经验的司机的驾驶数据，能够利用这些数据中的驾驶经验来处理ATO曲线跟踪问题。经过长时间的训练调试，针对地铁亦庄线，专家系统基本能够完整复现优秀司机的驾驶行为，达到很好的控制效果。同时该专家系统也存在自身的不足，如驾驶数据主要依靠人工输入，且只能是在亦庄线线路条件下使用。

2.4 自抗扰控制算法

2.4.1 自抗扰控制算法原理

自抗扰控制技术对系统模型的依赖度较低。二阶自抗扰控制器的结构如图3所示。其由如下3种功能组合而成：跟踪微分器用来安排过渡过程并提取其微分信号；扩张状态观测器(extended state observer，ESO)用来估计对象状态和不确定扰动作用；利用安排的过渡过程与状态估计之间误差的非线性组合和扰动估计量的补偿，即非线性反馈来生成控制信号。

图3 ADRC控制器结构

图3中，v0，v1，v2分别为目标速度、跟踪速度、跟踪加速度；z1，z2，z3分别为观测扰动、观测加速度、观测速度；e1，e2分别为跟踪速度误差和跟踪加速度误差；u0，u分别为非线性反馈的输出、系统控制量；w为扰动；b为系统增益；y为对象输出。

将采用的自抗扰控制器的设置分为以下步骤：

(1)列出传递函数方程

(14)

其中w(t)为扰动。

(2)安排过渡过程

(15)

(3)估计状态的扰动

(16)

(17)

(4)确定其中涉及到的两个非线性函数：

fst(x1，x2，r，h)和fal(ε，a，d)

fst(x1，x2，r，h)的定义为：

d=rh;d0=dh;

y=x1+hx2;

(18)

(19)

(20)

fal(ε，a，d)的定义如下：

(21)

2.4.2 自抗扰控制算法参数整定

粒子群算法是一种启发式全局优化算法，可以用于求解复杂优化问题。改进的粒子群算法[22]在粒子群算法的基础上引入了遗传算法中的选择，交叉、变异操作算子，可以提高搜索精度，避免局部最优。取定改进的粒子群算法的适应度函数如下

(22)

式中，w1，w2为权值；e(t)为系统误差；J为适应度函数值。

其中系统误差即为被控对象的输出和基于线路条件选定的ATO曲线之间的误差。能够使得适应度函数最小的ADRC参数，即为最优控制参数。

考虑到如式(5)所示的列车模型，依据调试经验将二阶自抗扰控制器的对控制效果影响较小的基础参数取为

h=0.001，r=28，δ=0.001，α1=0.7，α2=1.6

后续利用改进的粒子群算法，对二阶自抗扰控制器中影响较大的β01，β02，β03，β1，β2五个核心参数进行整定。

采用改进的粒子群算法对ADRC控制器核心参数进行整定的系统框图如图4所示，被控对象的输出以及系统输入与被控对象输出的差被用于计算适应度函数，适应度函数的值用于指导改进的粒子群算法的优化整定，整定结果用于更新ADRC核心参数。

图4 改进的粒子群算法对ADRC控制器参数的整定系统框图

对应的改进的粒子群算法优化整定流程如下。

(1)初始化粒子群，根据经验给定待整定的参数的上下界限。取初始值w1=1，w2=10，惯性权重wstart=0.93，wend=0.31，粒子群规模Size=70，搜索空间维数D=5，粒子群繁殖代数G=100。

(2)更新惯性权重因子和每个粒子的位置以及速度。

(3)计算每个粒子适应度函数值，即可选取得到ADRC控制器最优控制效果适应度函数值。

(4)对粒子群适应度函数值排序，最优的1/3进入下次迭代。并利用遗传算子对它们进行操作，产生新的一批粒子，并用它们代替原群体中间的1/3粒子。对于最后1/3粒子，进行维数随机初始变异，以避免局部最优的情况出现。

(5)对每个粒子，比较其当前位置适应度函数值与历史最优适应度函数值和全局最优适应度函数值的关系。如果其优于历史最优适应度函数值，则对应替换历史最佳位置和它的历史最优适应度函数值。如还优于全局最优适应度函数值，则对应替换全局最佳位置和全局最优适应度函数值，并记录该全局最优粒子位置。

(6)判断是否达到最大迭代次数，达到则算法结束，反之重复步骤2～步骤5。

经过100代迭代，最后可以得到最优的ADRC控制器参数：

β01=913，β02=1 579，β03=3 852，β1=5 338，β2=3 848

综合以上结论，得到最终的ADRC控制器参数值为

h=0.001，r=28，δ=0.001，β01=913，β02=1 579，

β03=3 852，α1=0.7，α2=1.6，β1=5 338，β2=3 848。

3 实验结果

3.1 4种控制算法控制曲线与误差

对PID算法，根据文献[2-3]提供的资料，将参数取为Kp=19.12，Ki=3.23，Kd=4.14。对模糊PID算法，根据文献[3]，搭建包含输入层、模糊化层、模糊推理层以及输出层的神经网络，控制参数初值取为Kp=19.12，Ki=3.23，Kd=4.14，γp(k)，γi(k)，γd(k)的初值分别取为2，0.5，0.5。对专家系统，根据文献[4-5]和亦庄线线路数据，搭建出在地铁亦庄线线路条件下，和有经验司机所做出的加速、减速、惰行、巡航决策基本一致的控制系统。ADRC算法参数按2.4.2节的结论进行选取。为便于比较，控制误差图中将速度单位由控制曲线图中的km/h转化为了m/s。MATLAB仿真后得出如图5所示的各控制算法跟踪曲线和如图6所示的各控制算法控制误差。

图5 各控制算法跟踪曲线

图6 各控制算法控制误差曲线

综合图5、图6可以看出。

(1)由图5(a)和图6(a)可知，基于PID控制算法的控制器跟踪曲线和ATO运行曲线偏离较大，相应的速度响应误差最大。

(2)由图5(b)和图6(b)可知，基于模糊PID控制算法的控制器跟踪曲线和ATO运行曲线偏离较小，相应的速度响应误差较PID控制算法的响应误差也稍小，曲线较平坦。

(3)基于PID控制算法和基于模糊PID控制算法的控制器跟踪曲线在某些ATO运行曲线速率变化大的地方，已经接近了ATP限速曲线。

(4)基于PID控制算法和基于模糊PID控制算法的控制器跟踪曲线在ATO运行曲线变化速率较大的地方出现较大超调，这会造成列车在实际运行过程中出现频繁加减速，从而大大降低旅客的舒适度。

(5)由图5(c)，图5(d)和图6(c)，图6(d)可知，基于专家系统的控制器和基于ADRC算法的控制器的跟踪曲线和ATO曲线基本重合，相应的速度响应误差很小，在速度响应误差图上除曲线开头和结尾部分有两个尖峰，其他区域基本是一条直线，对应的速度响应误差接近于零，且基本没有抖动。故基于专家系统和基于ADRC算法的控制器的跟踪性能优于基于PID算法的控制器和基于模糊PID算法的控制器，能较好地控制超调。

综上所述，基于专家系统和基于ADRC算法的控制器均可以精确跟踪预先设定的ATO运行曲线，整个跟踪过程的超调量很小，跟踪曲线几乎与ATO运行曲线重合。跟踪效果好于基于PID控制算法和基于模糊PID控制算法的控制器。

3.2 4种控制算法结果对比

为了进一步量化基于各控制算法的控制器的性能，根据3.1节得到的数据，在表2中对比了基于各控制算法的控制器对地铁列车ATO运行曲线进行跟踪过程中的速度误差、加速度、加速度变化率等参数。表3对比了这些参数所反映出的相应控制算法的性能指标。

表2 各控制算法对比

注：表中平均速度控制误差、最大速度控制误差、全程平均加减速度、全程平均加减速度变化率、最大加减速度、全程平均加减速度变化率、最大加减速度变化率，均采用绝对值进行统计。

由表2比较可以看出：

(1)基于ADRC算法的控制器的各项速度误差、加速度、加减速度变化率指标较基于PID算法的控制器和基于模糊PID算法的控制器都要低，仅比专家系统略高，这对于旅客舒适度指标是有利的。

(2)基于ADRC算法的控制器的全程加减速剧烈变化次数较少，全程总惰行距离较长，这对于列车节能是有益的。由于ADRC算法有极强的控制超调的能力，其最大速度控制误差低于基于专家系统的控制器，这可以有效增加列车停车精度，减少运行时间误差。

综上所述，基于ADRC算法的控制器在多项指标优于基于PID算法和基于模糊PID算法的控制器，其表现可以接近有丰富驾驶经验的司机。

表3 各控制算法性能指标对比

表3中的非舒适度指标、简化的能耗指标，在MATALB仿真中依据式(6)、式(7)计算得到。停车精度指标，运行时间误差指标在MATALB仿真完成后依据式(8)、式(9)相减得到。从表3可以看出，在性能指标方面：

(1)基于ADRC算法的控制器相较于基于PID算法的控制器，非舒适度指标下降18.6%，能耗指标降低15.9%，停车精度指标提高64.7%，运行时间误差指标减少76.7%；

(2)基于ADRC算法的控制器相较于基于模糊PID算法的控制器，非舒适度指标下降12.1%，能耗指标降低12.7%，停车精度指标提高了45.5%，运行时间误差指标减少63.5%；

(3)基于ADRC算法的控制器的各项性能指标和专家系统基本相同，且ADRC算法没有专家系统的苛刻应用条件，控制参数可以使用改进的粒子群算法快速整定，对控制模型的依赖程度较低，也不需要大量前期司机驾驶数据用于训练，故相比较而言，ADRC算法具有一定优越性和较好的鲁棒性。

4 结论

根据北京地铁亦庄线线路模型、有关文献中给出的列车模型、设计的速度控制器以及给定的ATO目标运行曲线，基于MATLAB软件仿真了地铁列车在地铁亦庄线宋家庄站到肖村站线路上的运行情况。通过对基于PID控制算法、模糊PID控制算法、专家系统、ADRC控制算法的控制器进行跟踪曲线、速度响应误差曲线、非舒适度指标、简化的能耗指标、停车精度指标、运行时间误差指标的对比，可以得出以下结论：ADRC控制算法综合了PID算法和现代控制算法的优势，基于ADRC控制算法的控制器与基于PID算法的控制器及基于模糊PID算法的控制器相比，能够更高效地对地铁列车的运行进行控制，其控制性能几乎与专家系统相当，且由于ADRC算法对控制模型的依赖小，控制参数可快速整定，不需要大量前期司机驾驶数据，固定的列车模型和线路条件。面对复杂多变的实际条件，ADRC算法的鲁棒性较专家系统更好。故ADRC算法是一种优越且适用的地铁列车驾驶控制算法。