当前位置：首页 > news >正文

两端约束的最优控制问题及其数值解法

news 2025/7/13 2:16:27

问题的基本形式

设 $n$ 维系统状态房产 $\dot{x}(t)=f[x(t),u(t),t]$ ，控制向量 $u(t)\in\Omega$ 是分段连续函数， $\Omega\in R^m$ 是有界闭集，满足约束 $g[x(t),u(t),t]\ge 0$ ，终端时刻固定为 $t_f$ 。目标是使状态从初态 $x(t_0)=x_0$ 转移到终态 $x(t_f)$ ，其中 $G[x(t_f),t_f]=0$ ，且使得性能指标 $J[u(t)]=\Phi[x(t_f),t_f]+\int_{t_0}^{t_f}L[x(t),u(t),t]dt$ 达到最小。

基本解法

构造Hamilton函数 $H[x(t),u(t),\lambda(t),t]=L[x(t),u(t),t]+\lambda(t)^Tf[x(t),u(t),t]$ 。设 $u^*(t)$ 为最优控制， $x^*(t)$ 是最优轨线，则存在与 $u=u^*(t)$ 和 $x=x^*(t)$ 对应的最优伴随向量 $\lambda=\lambda^*(t)$ ，使得： $\begin{cases} \dot{x}=\frac{\partial H}{\partial \lambda} \\ \dot{\lambda}=-\frac{\partial H}{\partial x}\\ \end{cases}$
其中， $u^*=\arg\min_{u\in \Omega}H[x^*(t),u(t),\lambda^*(t)]$ ；

上述方程同时还满足边界条件 $x(t_0)=x_0,G[x(t_f),t_f]=0$ ；

横截条件 $\lambda(t_f)=\frac{\partial \Phi(t_f)}{\partial x}+[\frac{\partial G(t_f)}{\partial x}]^Tv$ 。

数值解法

直接法

在考虑控制量约束 $g[x(t),u(t),t]\ge 0$ 和终端约束 $G[x(t_f),t_f]=0$ 存在的条件下，需要对原来的性能指标 $J [u (t)]$ 加罚函数项得到 $\bar{J}[u(t)]$ ：
$\bar{J}[u(t)]=J[u(t)]+\mu\sum_{i=1}^rG_i[x(t_f),t_f]^2+\eta\int_{t_0}^{t_f}\sum_{i=1}^l\min(g_i,0)^2dt$
直接法多采用梯度法及其变型进行求解，具体的计算步骤如下：

Step1. 根据经验选定初始控制 $u^0(t)$ ，允许误差 $\varepsilon>0$ ；

Step2. 将 $u^0(t)$ 代入状态方程并求解得到 $x^0(t)$ ；

Step3. 计算 $\bar{J}[u^0(t)]$ ，并根据协态方程从 $t_f$ 到 $t_0$ 反向积分计算 $\lambda^0(t)$ ；

Step4. 计算 $u^0$ 处的梯度 $\nabla \bar{J}[u^0(t)]=\frac{\partial H[x^0(t),u^0(t),\lambda^0(t),t]}{\partial u}$ ；

Step5. 确定搜索步长 $\alpha^0=\arg\min_{\alpha >0} \bar{J}[u^0-\alpha\nabla \bar{J}[u^0(t)]]$ ；

Step6. 修正控制向量 $u^1(t)=u^0(t)-\alpha^0\nabla \bar{J}[u^0(t)]$ ；

Step7. 若满足终止条件 $||\nabla \bar{J}[u^0(t)]||\leq \varepsilon$ ，则结束循环；否则，令 $u^0=u^1$ 回到Step2.

Step2和Step3往往是比较难计算的。

另外，若 $u (t)$ 满足上下界限约束，则在Step6中需要对 $u (t)$ 进行限幅。而针对横截条件中的 $v$ 可以采用 $2\mu G$ 估算：
$\lambda_i(t_f)=\frac{\partial \Phi(t_f)}{\partial x_i}+\sum_{j=1}^r2\mu G_j[x(t_f),t_f]\frac{\partial G_j(t_f)}{\partial x_i}$

间接法

直接法中修正后的控制向量 $u$ 不一定满足约束 $g\geq 0$ ，而是通过施加罚函数，限幅等手段进行迭代。而间接法则是尽量充分保证 $u$ 能满足约束 $g\geq 0$ ，这里给出间接法中的拟线性化方法实现逼近。该方法的核心是首先求出 $u(x,\lambda,t)$ 带入正则方程，引入增广状态 $Y(t)=[x(t),\lambda(t)]^T,Y(t)\in R^{2n}$ ，将正则方程转化为 $\dot{Y}=g(Y,t)$ ，再将该方程进一步线性化得到：
$\dot{Y}^{K+1}=(\frac{\partial g}{\partial Y})_KY^{K+1}+[g(Y^K,t)-(\frac{\partial g}{\partial Y})_KY^{K}]$
其中， $Y^K$ 代表第 $K$ 步迭代的解。若对于给定的 $\varepsilon>0$ ，当 $||Y^{k+1}(t)-Y^k(t)||\leq \varepsilon$ 时停止计算。