基于二阶变分的中制导最优弹道修正

2016-12-24 07:17雷虎民翟岱亮张大元王华吉李宁波
系统工程与电子技术 2016年12期
关键词:约束条件制导弹道

雷虎民, 周 觐, 翟岱亮, 张大元, 王华吉, 李宁波

(1. 空军工程大学防空反导学院, 陕西 西安 710051;2. 中国人民解放军95948部队, 甘肃 酒泉 732750)



基于二阶变分的中制导最优弹道修正

雷虎民1, 周 觐1, 翟岱亮1, 张大元2, 王华吉1, 李宁波1

(1. 空军工程大学防空反导学院, 陕西 西安 710051;2. 中国人民解放军95948部队, 甘肃 酒泉 732750)

针对反临近空间高超声速目标拦截作战过程中的中制导弹道的规划与修正问题,设计了一种最优弹道修正算法。首先分析了在中制导阶段进行弹道规划与弹道修正的必要性,基于庞特里亚金最小值原理给出了基准最优弹道满足的一阶必要性条件,其次将一阶必要性条件进行二阶变分,得到控制量的修正量,利用基准弹道数据,通过逆向积分,将协态变量的偏差量表示为终端约束修正量以及状态变量偏差量的表达式,从而有效解决了协态变量偏差量的获取问题,最后进行了多种情形下的数字仿真,对所提算法进行验证并与高斯伪谱法(Gauss pseudospectral method, GPM)进行对比。结果表明,该方法不仅具有较高的求解精度,并且其求解效率远高于GPM,有利于弹上在线实现。

中制导; 弹道修正; 二阶变分; 最优控制

0 引 言

近年来,临近空间高超声速飞行器的飞速发展对我国战略防御以及国土防空构成了严峻威胁,研究反临近空间高超声速目标的先进制导控制技术迫在眉睫。反临近空间高超声速目标作战的难点主要体现在以下两个方面:①临近空间高超声速目标飞行速度一般超过马赫数5,可拦截窗口小,这就要求拦截弹具备较高的飞行速度。另外,拦截弹从地面发射到临近空间进行作战,飞行空域变化较大,这些都对拦截弹的方案弹道提出了多种约束条件。传统的导引规律,如比例导引等已经很难适用,必须根据相关优化理论对拦截弹道进行离线设计,以满足各种约束条件。②临近空间高超声速目标具有较高的机动能力,拦截弹发射前的远距离探测对于其飞行轨迹难以进行精确的跟踪与预测,必须借助拦截弹的弹上设备进行抵近探测,对其轨迹进行不间断的跟踪、校正与预测,对预测命中点等信息进行调整更新。而拦截弹与目标较大的相对速度造成拦截过程非常短暂,末制导阶段更是转瞬即逝,这就要求拦截弹在中制导阶段必须具备一定的在线弹道修正与规划能力。

目前有关中制导弹道规划与修正的研究文献并不是很多,文献[1]借鉴比例导引方法的思想研究了一种广义最优中制导方法,将中制导末端速度以及预测命中点位置作为约束条件,分别设计了时变的速度误差项系数以及位置误差项系数,但对于过程约束并没有深入考虑。文献[2]应用粒子群优化方法,基于地形/威胁模型研究了无人机的航路规划问题。文献[3-4]首先将弹目运动模型进行线性化,借鉴弹道成型制导思想设计了最优制导律,然后考虑实际的非线性弹目运动模型,增加了拦截弹的末端角度约束,应用庞特里亚金最小值原理推导了最优弹道模型,应用高斯伪谱法解算出最优弹道。文献[5]以导引头视角为约束条件,研究了带有角度约束的中制导律,凭借一定的导引头视角阈值,将拦截弹弹道分为中制导以及末制导过程,仿真结果验证了其方法的有效性。文献[6]采用遗传算法对中制导弹道规划进行了求解。文献[7]针对粒子群优化方法收敛速度慢,序列二次规划方法对初值敏感并且容易陷入局部最优的缺点,将两种优化方法进行了整合,首先采用粒子群优化方法对最优化问题进行求解,当最优解收敛到一定阈值或迭代超过特定次数后,采用序列二次规划方法,将粒子群优化结果作为其初值,继续求解得到全局最优解。仿真结果表明,所设计的方法具有很好的鲁棒性及时效性。文献[8-9]采用模型静态预测规划的方法对中制导弹道规划问题进行了研究,模型静态预测规划基于离散化以后的系统状态方程,将最优弹道基础上产生的扰动量作为误差项,在最优弹道附近进行泰勒级数展开,通过迭代求解一次性得到最优控制量的补偿项,算法具有高效性及快速性的特点,虽然文章主要针对中制导弹道规划问题求解,但对于弹道修正方法同样具有一定的借鉴意义。文献[10]应用变时域邻域最优控制理论研究了月球飞行器的轨道修正问题。首先应用庞特里亚金最小值原理,将离线解算得到最优轨道相关矩阵存储在弹载计算机中,当终端约束条件发生变化时,将变化量作为扰动值代入到最优解的哈密尔顿方程以及状态方程中,假设Clebsch-Legendre条件成立,则可以一步求解,得到原最优控制基础上需要补偿的控制量,仿真结果验证了其所提算法的有效性。然而其应用对象为剩余时间变化的情况,对于反临近空间高超声速目标作战情形中,目标在固定的探测频率下的预测轨迹变化导致的拦截弹终端位置修正以及姿态修正问题并不能很好的适用。

以上研究大部分侧重于对于弹道的重新规划,针对由当前时刻的弹道状态、终端期望状态以及拦截弹状态方程构成的弹道优化问题,应用优化算法再次大范围寻优求解,完全舍弃了原有基准弹道的数据。事实上,当调整后的终端期望状态与原来的期望状态变化不大的情况下,可以利用原有的基准最优数据快速生成一条满足终端约束的优化轨迹[10],本文以此为出发点,通过对基准弹道的一阶最优性条件进行二阶变分,设计出了一种新的中制导最优弹道修正算法。

1 基准最优弹道

1.1 拦截弹运动模型

为研究方便并不失一般性,考虑如下纵向平面内的拦截弹质点运动模型[11]:

(1)

(2)

(3)

(4)

式中,V表示拦截弹速度;P表示作用在拦截弹上的推力。设定为在开始的20.3 s内为常值92.794 kN,燃料燃烧速度为34.796 2 kg/s[12],之后发动机关机,推力保持为零。q表示动压;S表示参考面积;g表示重力加速度;θ为弹道倾角;m为拦截弹质量;x,y分别为导弹在大地惯性坐标系下的位置;Cx,Cy分别为阻力系数以及升力系数,可以分别表示为马赫数Ma和攻角α的函数:

(5)

(6)

1.2 弹道优化模型

以t0表示初始时刻,终端时刻tf设定为拦截弹和目标的预测交会时刻,为保证拦截弹的直接碰撞杀伤效果,一般以终端时刻的速度最大作为优化指标J,即

J=φ(V(tf),tf)=-Vf

(7)

终端时刻的预测命中点坐标表示为(xf,yf),同时为了在交接班时刻拦截弹能够达到合适的姿态,使得导引头成功探测捕获目标,设定终端时刻的弹道倾角目标值为θf。那么终端约束条件可以表示为

(8)

式中,0表示具有相应维度的全零矩阵。

在临近空间高速飞行的拦截弹将经历一系列恶劣的环境条件[13],与传统在大气层内飞行的拦截弹相比,其对于弹道的约束更加苛刻,需要考虑各种复杂约束条件,为了保证弹道的稳定性以及可实现性,对控制量进行如下约束:

‖α‖≤αmax

(9)

式中,αmax为最大攻角。

中制导的弹道优化模型可以表述为,寻找一系列容许控制量u=α,使之满足系统动态方程式(1)~式(4),终端约束式(8),以及过程约束式(9),同时使得指标函数式(7)达到最优。

(10)

然后将终端约束条件引入最优性指标中得到增广的优化指标J′:

(11)

(12)

(13)

(14)

(15)

(16)

间接法虽然具有较高的求解精度,但是其收敛域比较小,推导最优解的过程较为复杂和繁琐,并且协态变量的初值设置难以准确估计,这些都限制了其在最优控制问题求解中的应用。

直接法通过把状态变量离散化,将连续的最优控制问题转换成为离散的非线性规划问题,然后通过非线性规划求解算法得到最优解,与间接法相比,直接法的收敛域更加宽广,近年来兴起的高斯伪谱法(Gausspseudospectralmethod,GPM)就属于直接法中的一种。已证明[15]应用GPM得到的最优解满足一阶最优性条件式(12)~式(16),并且对于协态变量也能够精确获得,从而确保了其求解的精度。本文中利用GPM方法求解得到基准最优弹道数据,以上标*进行表示。

2 最优弹道修正

首先,对式(12)~式(16)进行二阶变分,可以得到:

(17)

(18)

(19)

(20)

(21)

如果∂2H/∂u2在整个飞行过程中非奇异,那么根据式(19)可以得到控制量的修正量δu的表达式为

(22)

从式(22)中可以看出,只要知道系统状态量的偏差δX和协态量的偏差δλ,根据基准最优弹道数据,就可以确定控制量的修正量δu,使之满足最优性条件。但是在实际工程应用过程中,状态量的偏差δX可以通过安装在拦截弹上的传感器或地面探测设备解算得到,而对于协态量的偏差δλ,并没有有效的方法进行测量或估计,所以必须对其进行进一步的推导,表示成为可以得到的状态量。

将式(22)代入到式(17)和式(18)中,状态量偏差δX和协态量偏差δλ的动态方程可以表示为

(23)

(24)

式中

(25)

(26)

(27)

δλ(t)=S(t)δX(t)+R(t)dν

(28)

(29)

(30)

(31)

将式(28)代入到式(23)中可以得到

(32)

将式(32)代入到式(30),与式(24)连立,可以得到变量S(t)和R(t)需要满足动态方程为

(33)

(34)

同理,将式(32)代入到式(31)中,可以得到变量Q(t)需要满足动态方程

(35)

将式(28),式(29)和式(20),式(21)进行比较可以得到变量S(t),R(t)和Q(t)的终端约束条件

(36)

(37)

Q(tf)=0

(38)

根据变量S(t),R(t)和Q(t)的终端约束条件式(36)~式(38)以及动态方程式(33)~式(35),对其进行逆向积分一直到初始时刻t0,根据式(29)可以解算得到dν的表达式为

(39)

将式(39)代入到式(28)中,可以得到初始时刻的协态量偏差δλ(t0):

(40)

将式(40)得到的协态量的偏差δλ(t0)作为初值,利用式(24)进行前向积分,就可以得到此后时刻的协态量偏差δλ,进而通过式(22)就可以得到任意时刻的控制量的修正量δu。

中制导最优弹道修正算法框图如图1所示,其运算步骤如下:

步骤 1 根据当前目标信息设定终端状态约束,根据GPM方法求解弹道优化问题,得到基准最优弹道数据,储存在弹载存储设备中;

步骤 2 对于目标状态进行不间断更新、预测,对预测命中点等信息进行修正,如果弹道终端约束状态发生较大变化,则转入步骤3,否则在此步骤进行循环;

图1 中制导最优弹道修正算法框图Fig.1 Block of the optimal midcourse trajectory modification

3 仿真验证

为验证本文提出的中制导最优弹道修正算法的有效性,开展以下2种情形下的数字仿真。仿真中的基准弹道通过GPM Matlab程序包GPOPS计算得到,中制导弹道的初始和终端约束如表1所示。

表1 中制导弹道的初始和终端约束

情形 1 此情形下的拦截想定为,在发动机工作阶段,拦截弹按照基准弹道飞行,发动机关机后无动力飞行阶段,对终端预测命中点进行修正,保持终端横坐标不变,高度提高2 km,即预测命中点修正为(88 000 m,37 000 m),终端弹道倾角约束θf为3°保持不变,将弹道修正算法得到的仿真结果与GPM得到的结果进行对比,如图2~图5所示。

图2 情形1中的修正弹道Fig.2 Curves of the modified trajectory in scenario one

图3 情形1中的速度曲线Fig.3 Curves of the velocity in scenario one

从图2中可以看到,由本文提出的最优弹道修正算法得到的弹道以及由GPM得到的弹道都能够很好地满足改变以后的终端约束条件,并且两种方法得到的弹道非常相近,约有80%以上部分发生重叠,在证明有效性的同时证明了本文方法的最优性。从图3中可以看到,调整以后的速度曲线与基准的速度曲线能够很好的重合,并未发生很大的变化,从而证明了最优弹道修正算法能够在满足终端约束的条件下确保优化指标保持一定的最优性。图4给出了弹道倾角的变化曲线,由于对终端的弹道倾角约束未做改变,最优弹道修正算法能够有效控制其收敛到原来的约束值。从图5中的控制量比较可以发现,最优弹道修正算法得到的修正量整体比较平滑,易于弹上的实现。表2给出了本文方法和GPM消耗时间的对比,从中可以看出,本文方法的计算效率是GPM方法的43倍,能够快速准确得到最优修正弹道,主要原因是,本文方法能够根据已有的基准弹道数据进行计算,而不需要如GPM一样舍弃原有的基准弹道数据,再次进行大范围的参数寻优,从而有效节约了时间,有利于弹道的实时计算更新。

图4 情形1中的弹道倾角曲线Fig.4 Curves of the flight path angle in scenario one

图5 情形1中的控制量曲线Fig.5 Curves of the control commands in scenario one

方法消耗时间/s本文方法0.04高斯伪谱法1.73

图6 情形2中的修正弹道Fig.6 Curves of the modified trajectory in scenario two

图7 情形2中的速度曲线Fig.7 Curves of the velocity in scenario two

从图6中可以看出,最优弹道修正算法得到的修正弹道总体比较平滑,满足了调整以后的终端状态约束,具有较高的求解精度。从图7中可以看出,调整以后的速度曲线基本保持了基准弹道的最优性指标,图8给出了弹道倾角变化曲线终端的弹道倾角达到4°,与约束值θf相差1°,基本能够满足指标要求。从图9给出的控制量曲线可以看出,控制指令基本比较平稳,只有在第二次修正时刻出现了比较大的跳变,总体上能够满足弹上实现的需求。

图8 情形2中的弹道倾角曲线Fig.8 Curves of the flight path angle in scenario two

图9 情形2中的控制量曲线Fig.9 Curves of the control commands in scenario two

4 结 论

本文通过对基准最优弹道的一阶最优性条件进行二阶变分,推导得到了一种最优弹道修正算法。针对反临近空间高超声速目标拦截作战过程中终端约束条件发生变化的情况下,该方法能够利用基准最优弹道数据解算得到最优的修正弹道,所得结果不仅具有较高的精确性,而且避免了传统优化方法的大范围再次寻优求解,有效节省时间,利于弹上的在线实现。

[1] Morgan R W, Noseck A P. Generalized optimal midcourse guidance[C]∥Proc.ofthe53rdIEEEConferenceonDecisionandControl, 2014: 260-264.

[2] Kamyar B, Taheri E. Aircraft optimal terrain/threat-based trajectory planning and control[J].JournalofGuidance,Control,andDynamics, 2014,37(2):466-483.

[3] Indig N, Ben-Asher J Z, Farber N. Near optimal spatial midcourse guidance law with an angular constraint[J].JournalofGuidance,Control,andDynamics, 2014,37(1):214-223.

[4] Indig N, Ben-Asher J Z, Sigal E. Near-optimal minimum time guidance under a spatial angular constraint in atmospheric flight[C]∥Proc.oftheAIAAGuidance,Navigation,andControlConference, 2015:1-29.

[5] Erer K, Tekin R, Ozgoren M K. Look angle constrained impact angle control based on proportional navigation[C]∥Proc.oftheAIAAGuidanceNavigationandControlConference, 2015:1-11.

[6] Cribbs H B. Genetics-based trajectory discovery for tactical missiles[C]∥Proc.oftheAIAA1stIntelligentSystemsTechnicalConference, 2004:1-6.

[7] Wang F B, Dong C H. Fast intercept trajectory optimization for multi-stage air defense missile using hybrid algorithm[J].ProcediaEngineering, 2013, 67: 447-456.

[8] Dwivedi P N, Bhattacharya A, Padhi R. Suboptimal midcourse guidance on interceptors for high-speed targets with alignment angle constraint[J].JournalofGuidance,Control,andDynamics, 2011,34(3):860-877.

[9] Halbe O, Raja R G, Padhi R. Robust reentry guidance of a reusable launch vehicle using model predictive static programming[J].JournalofGuidance,Control,andDynamics, 2014,37(1):134-148.

[10] Pontani M, Cecchetti G, Teofilatto P. Variable-time-domain neighboring optimal guidance applied to space trajectories[J].ActaAstronautica, 2015,115:102-120.

[11] Zhang D Y, Lei H M, Wu L, et al. A trajectory tracking guidance law based on the sliding mode variable structure control[J].SystemsEngineeringandElectronics, 2014, 36(4):721-727.(张大元,雷虎民,吴玲,等. 基于滑模变结构的弹道跟踪制导律设计[J].系统工程与电子技术, 2014,36(4):721-727.)

[12] Muzumdar D V. Guidance laws for a short-range attack missile[D]. Austin: University of Texas,1995.

[13] Zhang D Y, Lei H M, Shao L, et al. Interceptor trajectory programming for near space hypersonic target[J].JournalofNationalUniversityofDefenseTechnology, 2015,37(3):91-96.(张大元,雷虎民,邵雷,等. 临近空间高超声速目标拦截弹弹道规划[J].国防科技大学学报,2015, 37(3):91-96.)

[14] Yang X X, Yang H X, Wang P. Overview of pseudo-spectral method and its application in trajectory optimum design for flight vehicles[J].JournalofNationalUniversityofDefenseTechnology, 2015,37(4):1-8.(杨希祥,杨慧欣,王鹏.伪谱法及其在飞行器轨迹优化设计领域的应用综述[J].国防科技大学学报,2015, 37(4):1-8.)

[15] Benson D A, Huntington G T, Thorvaldsen T P, et al, Direct trajectory optimization and costate estimation via an orthogonal collocation method[J].JournalofGuidance,Control,andDynamics, 2006, 29(6):1435-1440.

Midcourse guidance optimal trajectory modification using the second variation

LEI Hu-min1, ZHOU Jin1, ZHAI Dai-liang1, ZHANG Da-yuan2, WANG Hua-ji1, LI Ning-bo1

(1.AirandMissileDefenseCollege,AirForceEngineeringUniversity,Xi’an710051,China;2.Unit95948ofThePLA,Jiuquan732750,China)

Aiming at the problem of the midcourse trajectory generation and modification in the interception against hypersonic targets in near space, a novel optimal trajectory modification algorithm is designed. Firstly, the demand for trajectory generation and trajectory modification in the midcourse phase is analyzed. The first order necessary conditions for the nominal optimal trajectory are given based on the Pontryagin minimization theory. Secondly, the first order necessary conditions are further differentiated to second variation to acquire the control modifications. The difficulty of the co-states deviations acquisition is solved by reversely integrating using the nominal trajectory information to get the expression with the terminal constraints modifications and the current states derivations. Finally, digital simulations under different scenarios are carried out to testify the effectiveness of the proposed algorithm and the results are compared with those given by the Gauss pseudospectral method (GPM). Simulations results show that the algorithm has the merits of high precision and efficiency than the GPM, which is preferable for the online realization.

midcourse guidance; trajectory modification; second variation; optimal control

2016-04-13;

2016-10-19;网络优先出版日期:2016-10-27。

国家自然科学基金(61573374, 61503408);航空科学基金(20150196006)资助课题

TJ 765

A

10.3969/j.issn.1001-506X.2016.12.19

雷虎民(1960-),男,教授,博士后,主要研究方向为飞行器制导与控制技术。

E-mail:hmleinet@21cn.com

周 觐(1989-),男,博士研究生,主要研究方向为空天拦截器导航、制导与控制。

E-mail:zhoujindr@yahoo.com

翟岱亮(1987-),男,博士研究生,主要研究方向为空天拦截器导航、制导与控制。

E-mail:quietzdl@126.com

张大元(1986-),男,博士,主要研究方向为空天拦截器导航、制导与控制。

E-mail:dayuanyjs@163.com

王华吉(1989-),男,博士研究生,主要研究方向为空天拦截器导航、制导与控制。

E-mail:whj20081744@163.com

李宁波(1992-),男,硕士研究生,主要研究方向为空天拦截器导航、制导与控制。

E-mail:904116103@qq.com

网络优先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20161027.1557.010.html

猜你喜欢
约束条件制导弹道
基于一种改进AZSVPWM的满调制度死区约束条件分析
弹道——打胜仗的奥秘
一维弹道修正弹无线通信系统研制
基于MPSC和CPN制导方法的协同制导律
基于在线轨迹迭代的自适应再入制导
基于PID控制的二维弹道修正弹仿真
带有攻击角约束的无抖振滑模制导律设计
消除弹道跟踪数据中伺服系统的振颤干扰
复合制导方式确保精确入轨
基于半约束条件下不透水面的遥感提取方法