【MPC】模型预测控制笔记 (3)：无约束输出反馈MPC-EW帮帮网

前言

致谢【模型预测控制（2022春）lecture 3-1 Output feedback MPC】

输出反馈MPC

针对更通用的系统：
$\begin{align*} x_{k+1} &= Ax_k + Bu_k \\ y_k &= Cx_k \end{align*} \tag{1}$
其中， $x_k \in \mathbb{R}^n$ 是系统的全状态， $u_k \in \mathbb{R}^p$ 是系统的输入， $y_k \in \mathbb{R}^m$ 是可知的系统输出。
当 $m < n$ 时，说明部分状态不可测量，需要增加观测器来观测系统的全状态，此前提是系统是可观测的（能观性）。
由此即可通过系统的输出反馈来设计 MPC 控制器。

将要用到的基础概念参考：《现代控制理论（第3版） (刘豹,唐万生) 》

【基础】系统能控性

定义：若存在连续的输入 $u (t)$ ，可在有限时间 $t_0, ~ t_f]$ 内，使系统从状态 $x(t_0)$ 到达任一终端状态 $x(t_f)$ ，则称该状态是能控的。若系统每一状态都能控，则称系统是能观的。

简单理解就是：系统中每个子状态都独立地直接或间接地受输入影响则可控。

【基础】系统能观性

定义：若系统在有限观测时间 $t_f > t_0$ 内，可根据 $t_0, ~ t_f]$ 期间输出的 $y (t)$ ，唯一地确定系统状态 $x(t_0)$ ，则称该状态是能观的。若系统每一状态都能观测，则称系统是能观的。

针对离散系统的简单理解就是：
将系统 $k$ 时刻的全状态 $x_k$ 分为两块，记 $x_k = x_k^+ \cup x_k^-$ ，
系统输出 $y_k$ 可能只与部分的系统状态 $x_k^+$ 存在联系，若系统中与 $y_k$ 没有直接关系的状态 $x_k^-$ ，其与 $x_k^+$ 存在联系，
就可通过有限的多时刻的系统输出 $y_k,y_{k+1},\cdots$ ，建立足够多的独立方程，求解出系统的全状态 $x_k$ .
故 $x_k^-$ 与 $x_k^+$ 是否存在联系决定了系统的能观性。

《现代控制理论（第3版） (刘豹,唐万生) 》中给出了许多系统能控/观性的判定方法。

【基础】能控性和能观性的对偶关系

在这里插入图片描述
对偶关系定义：
系统 $\sum _1$ ：
$\begin{align*} \dot{x}_1 &= A_1 x_1 + B_1 u_1 \\ \dot{y}_1 &= C_1 x_1 \end{align*}$
系统 $\sum _2$ ：
$\begin{align*} \dot{x}_2 &= A_2 x_2 + B_2 u_2 \\ \dot{y}_2 &= C_2 x_2 \end{align*}$
若：
$A_2 = A_1^T, \quad B_2 = C_1^T, \quad C_2 = B_1^T$
则称系统 $\sum _1$ 和 $\sum _2$ 是互为对偶的。

对偶原理：
系统 $\sum _1$ 和 $\sum _2$ 是互为对偶，则 $\sum _1$ 的能控性等价于 $\sum _2$ 的能观性， $\sum _1$ 的能观性等价于 $\sum _2$ 的能控性。

应用：
在设计观测器的观测增益 $L$ 时，可通过对偶的控制系统，使用控制器设计方法设计最优反馈增益 $K$ ，有 $L = K^T$ .

一、观测器设计

1.1 线性观测器设计

针对系统 (1)，设 $k$ 时刻观测的状态为 $\hat{x}_{k}$ ，线性观测器可设计为：
$\hat{x}_{k+1} = A\hat{x}_{k} + Bu_k + H(y_k - C\hat{x}_{k}) \tag{2}$
上式可称为观测器状态方程，其中 $H$ 为观测增益.

1.2 误差（稳定性）分析

定义误差为 $\tilde{x}_k = x_k - \hat{x}_{k}$ ，由系统状态方程-观测器状态方程得：
$\tilde{x}_{k+1} = A\tilde{x}_k - L(y_k - C\hat{x}_{k})$
将输出方程代入上式可整理得：
$\tilde{x}_{k+1} = (A-LC)\tilde{x}_k \tag{3}$
由李雅普诺夫稳定性间接法可知，当 $|\mathrm{eig}(A-LC)|<1$ 时，误差将趋于 0.

$L$ 可通过其对偶系统来设计。
式 (3) 可以写为： $\tilde{x}_{k+1} = A^\prime \tilde{x}_k$ ，其中 $A^\prime = (A-LC)$ .
对偶系统为
$\begin{align*} \tilde{x}_{k+1} &= (A-LC)^T \tilde{x}_k\\ \Rightarrow \tilde{x}_{k+1} &= A^T\tilde{x}_k - C^T L^T \tilde{x}_k \end{align*}$
以上形式就转为了我们熟悉的线性反馈控制系统的形式： $x_{k+1} = Ax_k - BKx_k$ .
我们可用极点配置或最优控制来设计增益使系统渐近稳定.
因为 $\mathrm{eig}(A^\prime) = \mathrm{eig}((A^\prime)^T)$ ，所以当控制系统渐近稳定，观测器误差也将收敛为0.

1.3 MATLAB实例

针对式 (2) 形式的观测器，需要使式 (3) 系统的状态稳定为 $\mathbf{0}$ .
设系统中 $\begin{bmatrix} 1.1 & 2 \\ 0 & 0.95 \end{bmatrix}$ ， $\begin{bmatrix} 0 \\ 0.079 \end{bmatrix}$ ， $\begin{bmatrix} 1 & 0 \end{bmatrix}$ .
设计观测增益 $L$ ，使 $|\mathrm{eig}(A-LC)|<1$ ，即可使观测器误差收敛为0.

下面将根据对偶原理，使用极点配置法和基于对偶原理的LQR方法来设计.
式 (3) 的对偶系统为：
$\tilde{x}_{k+1} = A^T\tilde{x}_k - C^T L^T \tilde{x}_k$
对应控制系统：
$\tilde{x}_{k+1}^\prime = A^\prime\tilde{x}_k^\prime - B^\prime K^\prime \tilde{x}_k^\prime$
其中 $A^\prime = A^T$ ， $B^\prime = C^T$ ， $K^\prime = L^T$ .

1.3.1 极点配置

A = [1.1 2;0 0.95];
B = [0; 0.079];
C = [1, 0];

Ap = A';
Bp = C';

%% 极点配置
p = [0.5 + 0.5j, 0.5 - 0.5j]; % 适当选取极点
K = place(Ap, Bp, p);

L = K';
disp(eig(A - L*C))
disp(abs(eig(A - L*C)))

得 $\begin{bmatrix} 1.0500 \\ 0.2263 \end{bmatrix}$ .

1.3.2 LQR设计最优增益

LQR相关内容可参考离散LQR原理 .

A = [1.1 2;0 0.95];
B = [0; 0.079];
C = [1, 0];

Ap = A';
Bp = C';

%% LQR 最优增益
K = LQR(Ap, Bp, eye(2), 0.1, 500, 1e-6);
L = K';
disp(eig(A - L*C))
disp(abs(eig(A - L*C)))
%%
function K = LQR(A, B, Q, R, maxIter, eps)
% A、B分别为系统矩阵和输入矩阵，Q和R分别为状态误差和输入的对角权重矩阵
% maxIter为最大迭代步数N，eps为迭代精度C
	i = 1; P = Q; delta = 1e9;
	while i < maxIter && delta > eps
	    Pn = Q + A' * (P - P*B* inv(R+B'*P*B) *B'*P) * A;
	    delta = max(abs(Pn-P), [], "all");
	    P = Pn;
	    i = i+1;
	end
	K = inv(R + B' * P * B) * B' * P * A;
end

得 $\begin{bmatrix} 1.8342 \\ 0.3571 \end{bmatrix}$ .

二、无约束输出反馈MPC

针对系统：
$\begin{align*} x_{k+1} &= Ax_k + Bu_k \\ y_k &= Cx_k \end{align*}$
由【MPC】模型预测控制笔记 (1)：无约束MPC 可知，
无约束MPC的输入可写为状态反馈形式：
$u_k = -Kx_k$
其中 $[I_{p\times p} ~0 ~0 ~\cdots ~0](\mathcal{H}^T \mathcal{Q}^\prime \mathcal{H} + \mathcal{R}^\prime)^{-1}\mathcal{H}^T \mathcal{Q}^\prime \mathcal{G}$ .
无约束输出反馈MPC可直接使用观测器观测状态代替真实状态：
$u_k = -K\hat{x}_k$
其中 $\hat{x}_{k+1} = A\hat{x}_{k} + Bu_k + L(y_k - C\hat{x}_{k})$ ，记观测误差为 $\tilde{x}_k = x_k - \hat{x}_{k}$ .
系统可改写为：
$\begin{align*} x_{k+1} &= Ax_k - BK\hat{x}_k \\ &= Ax_k - BK(x_k - \tilde{x}_k) \end{align*} \tag{4}$

观测误差可写为：
$\tilde{x}_{k+1} = (A-LC)\tilde{x}_k \tag{5}$

2.1 稳定性分析

构建增广系统：
$\begin{align*} \begin{bmatrix} x_{k+1} \\ \tilde{x}_{k+1} \end{bmatrix} = \begin{bmatrix} A-BK & BK \\ 0 & A - LC \end{bmatrix} \begin{bmatrix} x_{k} \\ \tilde{x}_{k} \end{bmatrix} \end{align*}$
系统的的稳定性取决于
$\begin{align*} A_{aug} = \begin{bmatrix} A-BK & BK \\ 0 & A - LC \end{bmatrix} \end{align*}$ 的特征值。
当 $|\mathrm{eig}(A_{aug})|<1$ 时，系统渐近稳定，其中 $\mathrm{eig}(A_{aug}) = \mathrm{eig}(A-BK) \cup \mathrm{eig}(A-LC)$ .
由此可见，整体系统的稳定性取决了控制器和观测器，这两部分可独立设计，
但需要注意的时，观测器应收敛得比控制器更快，否则，控制器会根据不准确的观测结果将系统控歪。

线性代数基础：三角分块矩阵的特征值为其对角子块上的特征值集合。

证明：
首先证明三角分块矩阵的行列式等于其对角子块行列式的乘积（参考：分块矩阵行列式的性质证明）：
性质1：从一行（列）中减去另一行（列）的倍数，行列式保持不变．
性质2：三角矩阵的行列式为其主对角线上元素的乘积．
参考：《线性代数导论：第五版 (（美）Gilbert Strang著海昕, 文军, 屈龙江, 钱旭译) 》
设
$\begin{align*} &|D| = \begin{vmatrix} a_{11} & \cdots & a_{1k} & & & \\ \vdots & & \vdots & & 0 & \\ a_{k1} & \cdots & a_{kk} & & & \\ c_{11} & \cdots & c_{1k} & b_{11} & \cdots & b_{1n} \\ \vdots & & \vdots & \vdots & & \vdots \\ c_{n1} & \cdots & c_{nk} & b_{n1} & \cdots & b_{nn} \end{vmatrix}, &|D_{1}| = \begin{vmatrix} a_{11} & \cdots & a_{1k} \\ \vdots & & \vdots \\ a_{k1} & \cdots & a_{kk} \end{vmatrix}, &|D_{2}| = \begin{vmatrix} b_{11} & \cdots & b_{1n} \\ \vdots & & \vdots \\ b_{n1} & \cdots & b_{nn} \end{vmatrix} \end{align*}$
分别通过行变换和列变换可得：
$\begin{align*} &|D_{1}| = \begin{vmatrix} p_{11} & \cdots & 0 \\ \vdots & \ddots & \vdots \\ p_{k1} & \cdots & p_{kk} \end{vmatrix} = \mathrm{p}_{11} \mathrm{p}_{22} \cdots \mathrm{p}_{\mathrm{kk}}, &|D_{2}| = \begin{vmatrix} q_{11} & \cdots & 0 \\ \vdots & \ddots & \vdots \\ q_{n1} & \cdots & q_{nn} \end{vmatrix} = \mathrm{p}_{11} \mathrm{p}_{22} \cdots \mathrm{p}_{\mathrm{nn}} \end{align*}$
有：
$\begin{align*} |D| = \begin{vmatrix} p_{11} & \cdots & 0 & & & \\ \vdots & & \vdots & & 0 & \\ p_{k1} & \cdots & p_{kk} & & & \\ c_{11} & \cdots & c_{1k} & q_{11} & \cdots & 0 \\ \vdots & & \vdots & \vdots & & \vdots \\ c_{n1} & \cdots & c_{nk} & q_{n1} & \cdots & q_{nn} \end{vmatrix} \end{align*} = \mathrm{p}_{11} \mathrm{p}_{22} \cdots \mathrm{p}_{\mathrm{kk}} \cdot \mathrm{p}_{11} \mathrm{p}_{22} \cdots \mathrm{p}_{\mathrm{nn}} = |D_1||D_2|$
在计算特征值时有：
$|D-\lambda I| = |D_1-\lambda I| |D_2-\lambda I| = 0$
故三角分块矩阵的特征值为其对角子块上的特征值集合得证.

2.2 MATLAB实例

针对系统 (1)，设系统中 $\begin{bmatrix} 1.1 & 2 \\ 0 & 0.95 \end{bmatrix}$ ， $\begin{bmatrix} 0 \\ 0.079 \end{bmatrix}$ ， $\begin{bmatrix} 1 & 0 \end{bmatrix}$ .
由【MPC】模型预测控制笔记 (1)：无约束MPC 可知控制器反馈增益 $[I_{p\times p} ~0 ~0 ~\cdots ~0](\mathcal{H}^T \mathcal{Q}^\prime \mathcal{H} + \mathcal{R}^\prime)^{-1}\mathcal{H}^T \mathcal{Q}^\prime \mathcal{G}$ ，
计算可得 $\begin{bmatrix} 2.6167 \\ 12.9286 \end{bmatrix}$ ，MATLAB代码如下：

%% 选取K并检验系统是否稳定 
A = [1.1 2;0 0.95];
B = [0; 0.079];
K = [1.4 5.76];

eigSys = eig(A - B*K);
disp(abs(eigSys))
%% 求解P
K = [1.4 5.76];
Q = eye(2);
R = 0.1;
syms P [2 2] % P 为2*2的矩阵
equ = P - (A - B*K)' * P * (A - B*K) == Q + K'*R*K;
Psol = solve(equ, P);
Psol = [Psol.P1_1, Psol.P2_1; Psol.P2_1, Psol.P2_2];
Psol = double(Psol);
disp(Psol)
%% 计算G、H
N = 4;
[G, H] = getGH(N, A, B);
%% 计算Q、R、K
[Qp, Rp] = getQR(N, Q, Psol, R);
Kp = [eye(1), kron(ones(1, N-1), zeros(1))] * inv(H'*Qp*H + Rp)*H'*Qp*G;
% getGH等函数参见前面的博客

由 1.3 中可知观测增益 .
最终得到的系统的动态如下：
( $\begin{bmatrix} 1.8342 \\ 0.3571 \end{bmatrix}$ )
在这里插入图片描述
( $\begin{bmatrix} 1.0500 \\ 0.2263 \end{bmatrix}$ )

MATLAB演示代码：

A = [1.1 2;0 0.95];
B = [0; 0.079];
C = [1, 0];
K = [2.6167, 12.9286];
% L = [1.05; 0.2263];
L = [1.8342; 0.3571];

xCur = [1.2;-0.7]; % 设初始状态为[1;1]
xLog = xCur;
xHatCur = [0;0]; % 设初始状态为[0;0]
xHatLog = xHatCur;
uLog = [];

step = 0:50;
u = 0;
for i = step

    u = -K * xHatCur;

    yCur = C * xCur; % y_k
    xHatCur = A * xHatCur + B*u + L * (yCur - C * xHatCur); % xHat_k+1
    xCur = A*xCur + B*u; % x_k+1

    xHatLog = [xHatLog, xHatCur];
    xLog = [xLog, xCur];
    uLog = [uLog, u];
end

figure(1)
subplot(3,1,1)
hold on
plot(step, xLog(1,1:end-1))
plot(step, xHatLog(1,1:end-1))
title('x1')
grid on
subplot(3,1,2)
hold on
plot(step, xLog(2,1:end-1))
plot(step, xHatLog(2,1:end-1))
title('x2')
grid on
subplot(3,1,3)
plot(step, uLog)
title('u')
grid on

【MPC】模型预测控制笔记 (3)：无约束输出反馈MPC

目录

前言

输出反馈MPC

将要用到的基础概念参考：《现代控制理论（第3版） (刘豹,唐万生) 》

【基础】系统能控性

【基础】系统能观性

【基础】能控性和能观性的对偶关系

一、观测器设计

1.1 线性观测器设计

1.2 误差（稳定性）分析

1.3 MATLAB实例

1.3.1 极点配置

1.3.2 LQR设计最优增益

二、无约束输出反馈MPC

2.1 稳定性分析

2.2 MATLAB实例

网站公告

今日签到

热门文章

最新发布

【MPC】模型预测控制笔记 (3)：无约束输出反馈MPC

目录

前言

输出反馈MPC

将要用到的基础概念 参考：《现代控制理论（第3版） (刘豹,唐万生) 》

【基础】系统能控性

【基础】系统能观性

【基础】能控性和能观性的对偶关系

一、观测器设计

1.1 线性观测器设计

1.2 误差（稳定性）分析

1.3 MATLAB实例

1.3.1 极点配置

1.3.2 LQR设计最优增益

二、无约束输出反馈MPC

2.1 稳定性分析

2.2 MATLAB实例

网站公告

今日签到

热门文章

最新发布

将要用到的基础概念参考：《现代控制理论（第3版） (刘豹,唐万生) 》