一类时间不一致控制问题*

2022-11-19 02:27
关键词:决策问题中求最优控制

计 伟

(贵州建设职业技术学院信息管理学院,贵州 贵阳 551400)

时间偏好与风险偏好在任何投资和决策问题中都起着至关重要的作用,二者使得投资和决策问题具有不可预测性和复杂性,进一步导致问题具有时间不一致性,且时间不一致问题远多于时间一致问题.例如,货币的通胀与紧缩现象、个人选择、股票的购买与出售等.

事实上,时间不一致问题可以追溯到1739年,但直到20世纪50年代,Strotz[1]才首次对其进行数学公式化.之后,时间不一致问题主要划分为实证研究和理论研究.时间不一致问题的理论研究,是金融学与数学的前言交叉课题,近10年应用数学家和金融学家对其开展了大量研究,取得了丰富的研究成果[2-12].笔者拟利用Hu等[10]引进的均衡控制及其经典变分法和极限思想,对一类一般帖现因子的时间不一致控制问题展开讨论,旨在研究经典控制问题的最优控制与时间不一致控制问题的均衡控制之间的关系.

1 数学模型和预备知识

本研究从经典的最优控制问题开始叙述.设T>0和U⊆Rm是一个非空的有界闭凸集.定义可行控制集为

U[s,t]≡{u:[s,t]→U|u(·)可测} ∀0≤s≤t≤T,

给定y0∈Rn,考虑如下控制系统:

(1)

(2)

为了度量控制u的性能指标,引进目标泛函

(3)

其中h:[0,T]×Rn×[0,T]×Rn×U→R和G:{T}×Rn×Rn→R均为给定的映射.

考虑如下最优控制问题:

问题1对于系统(2),在控制集U[s,T]中求控制函数u,使得性能指标(3)极小化,即

问题1是一个经典控制问题,利用Bellman最优性原理和Pontryagin极大值原理可对其进行求解[13-14].关于问题1的研究,有一个前置条件,即时间一致性.但是,现实问题因资源的有限性、政策设施的滞后性、决策制定者文化及能力的限制性等,往往并不是如此简单,通常表现为时间不一致性,其数学模型可描述如下:

问题2对于系统(2),在控制集U[s,T]中求控制函数u,使得

(4)

其中

(5)

显然,目标泛函(5)依赖于初始对(s,y).于是,这时的优化问题变得复杂,因为随着时间s的变化,优化的不是一个问题,而是一族问题,甚至可能是无穷不可数个问题.这就意味着不能采用传统的经典方法,甚至不能使用经典最优控制问题解的定义.

其中

引入如下假设条件:

(P1)映射g:[0,T]×Rn×Rm→Rn连续可微,且存在常数L>0,使得

|g(t,x1,u1)-g(t,x2,u2)|≤L(|x1-x2|+|u1-u2|) ∀t∈[0,T],x1,x2∈Rn,u1,u2∈Rm.

(P2)映射h:[0,T]×Rn×[0,T]×Rn×Rm→R和H:[0,T]×Rn×Rn→R连续可微,且存在常数α>0,β>0和γ>0,使得φ(s,y;t,x,u)=h(s,y;t,x,u),H(s,y;x)满足

|φ(s,y;t,x,u)|≥α(|x|+|y|)+β|u|-γ∀t∈[0,T],x,y∈Rn,u∈Rm.

(P3)映射h关于控制变量是一个弱下半连续的凸函数.

2 主要结果及其证明

先引进如下记号:T表示矩阵或向量的转置,gx表示g(t,x,u)关于第2个变量的偏导数,gu表示g(t,x,u)关于第3个变量的偏导数,hs表示h(s,y;t,x,u)关于第1个变量的偏导数,hy表示h(s,y;t,x,u)关于第2个变量的偏导数,hx表示h(s,y;t,x,u)关于第4个变量的偏导数,hu表示h(s,y;t,x,u)关于第5个变量的偏导数,Hs表示H(s,y;x)关于第1个变量的偏导数,Hy表示H(s,y;x)关于第2个变量的偏导数,Hx表示H(s,y;x)关于第3个变量的偏导数.

以及

定理1假设条件(P1)~(P3)成立.若y0∈Rn固定,则问题1的最优控制是问题2的均衡控制.

(6)

于是,

由假设条件(P1),(P2)和(6)式,可得

猜你喜欢
决策问题中求最优控制
概率统计中的决策问题
创新视角下统计数据的合理决策问题
条件平均场随机微分方程的最优控制问题
等差数列中求Sn最值的几种策略
谈高中语文如何在“新”中求效
이보촉온(以保促穩) ·온중구진(穩中求進)-20년20 중국 양회(兩會) ‘ 메시지’를 읽다
带跳跃平均场倒向随机微分方程的线性二次最优控制
Timoshenko梁的边界最优控制
作战方案仿真实验自动指挥决策问题研究
采用最优控制无功STATCOM 功率流的解决方案