矩阵的相似对角形-EW帮帮网

1-10 矩阵的相似对角形

线性变换理论要研究的一个主要问题是：对于 $n$ 维线性空间 $V$ 上的线性变换 $\mathscr{A}$ ，是否存在 $V$ 的一个基使得 $\mathscr{C}$ 在这个基下的矩阵为对角矩阵。

定义1．10．1 数域 $F$ 上的 $n$ 维线性空间 $V$ 的线性变换 $\mathcal{B}$ 称为可对角化的，如果 $V$ 中存在一个基，使得 $\mathscr{A}$ 在这个基下的矩阵为对角矩阵。

定义1．10．2 若 $n$ 阶矩阵 $\boldsymbol{A}$ 与对角矩阵相似，则称 $\boldsymbol{A}$ 可对角化，也称 $\boldsymbol{A}$ 是单纯矩阵。

设 $\mathscr{A}$ 是 $n$ 维线性空间 $V$ 的线性变换， $\mathscr{A}$ 在基 $\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n$ 下的矩阵表示为 $\boldsymbol{A}$ ，即

$\mathscr{A}\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right)=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right) \boldsymbol{A}$

不难证明：
定理1．10．1 线性变换 $\mathscr{A}$ 可对角的充分必要条件是 $\boldsymbol{A}$ 可对角化．（证略）由此可见，我们只需研究矩阵的可对角化问题即可。

一，矩阵 $\boldsymbol{A}$ 可对角化条件
定理1．10．2 $n$ 阶矩阵 $\boldsymbol{A}$ 可对角化的充要条件 $\boldsymbol{A}$ 有 $n$ 个线性无关的特征向量．
证明必要性：设满秩矩阵 $\boldsymbol{P}$ ，满足

$\boldsymbol{P}^{-1} \boldsymbol{A P}=\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right)$

把 $\boldsymbol{P}$ 按列向量进行分块

$\boldsymbol{P}=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right)$
将式（1．10．2）代人式（1．10．1）得

$\boldsymbol{A}\left(\boldsymbol{\alpha}_1, \cdots, \boldsymbol{\alpha}_n\right)=\left(\boldsymbol{\alpha}_1, \cdots, \boldsymbol{\alpha}_n\right) \operatorname{diag}\left(\lambda_1, \lambda_1, \cdots, \lambda_n\right)$

于是

$\boldsymbol{A} \boldsymbol{\alpha}_i=\lambda_i \boldsymbol{\alpha}_i \quad(i=1,2, \cdots, n)$

因为 $\boldsymbol{P}$ 是满秩的，所以 $\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n$ 是线性无关的．从而由式（1．10．1）知， $\boldsymbol{A}$ 有 $\boldsymbol{n}$ 个线性无关的特征向量．

充分性：设 $\boldsymbol{A}$ 有 $n$ 个线性无关的特征向量 $\boldsymbol{\alpha}_1, \cdots, \boldsymbol{\alpha}_n$ ，即 $\boldsymbol{A} \boldsymbol{\alpha}_i=\lambda_i \boldsymbol{\alpha}_i \quad(i=$ $\cdots, n)$ 。命

$\boldsymbol{P}=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right)$

显然 $\boldsymbol{P}$ 是满秩的．故
即

$\begin{aligned} \boldsymbol{A} \boldsymbol{P}= & \boldsymbol{A}\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right) \\ = & \left(\boldsymbol{A} \boldsymbol{\alpha}_1, \boldsymbol{A} \boldsymbol{\alpha}_2, \cdots, \boldsymbol{A} \boldsymbol{\alpha}_n\right) \\ = & \left(\lambda_1 \boldsymbol{\alpha}_1, \lambda_2 \boldsymbol{\alpha}_2, \cdots, \lambda_n \boldsymbol{\alpha}_n\right) \\ = & \left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right) \operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right) \\ = & \boldsymbol{P} \operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right) \\ & \boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}=\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right) \end{aligned}$

推论设 $\boldsymbol{P}^{-1} \boldsymbol{A P}=\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right)$ ，则 $\lambda_1, \lambda_2, \cdots, \lambda_n$ 是 $\boldsymbol{A}$ 的 $n$ 个特征值， $\boldsymbol{P}$ 的第 $i$ 个列向量是 $\boldsymbol{A}$ 的属于 $\lambda_i$ 的特征向量．

由定理1．10．2可见，并不是任何一个线性变换都存在一个基，使其在该基下的矩阵表示呈现对角形．若一个线性变换在某组基下的矩阵表示是对角形，便称这线性变换是可对角化变换．

例1．10．1 已知线性微分方程组

$\left\{\begin{array}{l} \frac{\mathrm{d} x_1}{\mathrm{~d} t}=a_{11} x_1+a_{12} x_2+\cdots+a_{1 n} x_n \\ \frac{\mathrm{~d} x_2}{\mathrm{~d} t}=a_{21} x_1+a_{22} x_2+\cdots+a_{2 n} x_n \\ \vdots \\ \frac{\mathrm{~d} x_n}{\mathrm{~d} t}=a_{n 1} x_1+a_{n 2} x_2+\cdots+a_{n n} x_n \end{array}\right.$

令

$\boldsymbol{X}=\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right), \quad \frac{\mathrm{d} \boldsymbol{X}}{\mathrm{~d} t}=\left(\begin{array}{c} \frac{\mathrm{d} x_1}{\mathrm{~d} t} \\ \vdots \\ \frac{\mathrm{~d} x_n}{\mathrm{~d} t} \end{array}\right), \quad \boldsymbol{A}=\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right]$

则方程组（1）的矩阵形式为
$\frac{\mathrm{d} \boldsymbol{X}}{\mathrm{~d} t}=\boldsymbol{A} \boldsymbol{X}$

若 $\boldsymbol{A}$ 可对角化，即存在 $\boldsymbol{P} \in C_n^{n \times n}$ ，使得

$\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}=\boldsymbol{\Lambda}=\operatorname{diag}\left(\lambda_1, \cdots, \lambda_n\right)$

命

$X = P Y$

其中 $\boldsymbol{Y}=\left(\begin{array}{c}y_1 \\ \vdots \\ y_n\end{array}\right)$ ，把式（3）代人式（2）得

$\frac{\mathrm{d}(\boldsymbol{P} \boldsymbol{Y})}{\mathrm{d} t}=\boldsymbol{A} \boldsymbol{P} \boldsymbol{Y}$

即

$\boldsymbol{P} \frac{\mathrm{d} \boldsymbol{Y}}{\mathrm{~d} t}=\boldsymbol{A} \boldsymbol{P} \boldsymbol{Y}$

以 $\boldsymbol{P}^{-1}$ 左乘上式两端得

$\begin{aligned} & \frac{\mathrm{d} \boldsymbol{Y}}{\mathrm{~d} t}=\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P} \boldsymbol{Y}=\boldsymbol{\Lambda} \boldsymbol{Y} \\ & \left\{\begin{array}{l} \frac{\mathrm{d} y_1}{\mathrm{~d} t}=\lambda_1 y_1 \\ \frac{\mathrm{~d} y_2}{\mathrm{~d} t}=\lambda_2 y_2 \\ \vdots \\ \frac{\mathrm{~d} y_n}{\mathrm{~d} t}=\lambda_n y_n \end{array}\right. \end{aligned}$

因此

$y_1=c_1 \mathrm{e}^{\lambda_1 t}, \quad y_2=c_2 \mathrm{e}^{\lambda_2 t}, \cdots, y_n=c_n \mathrm{e}^{\lambda_n t}$

代人方程组（3）求得微分方程解 $x_1, x_2, \cdots, x_n$
定理 1．10．3 矩阵 $\boldsymbol{A}$ 可对角化的充要条件是 $\boldsymbol{A}$ 的每一个特征值的几何重复度等于代数重复度。

证明设 $n$ 阶矩阵的谱为 $\left\{\lambda_1, \lambda_2, \cdots, \lambda_r\right\} . \lambda_i$ 的代数重复度为 $p_i$ ，几何重复度为 $q_i(i=1,2, \cdots, r)$ ．则

$p_1+p_2+\cdots+p_r=n$

由定理1．8．5知

$q_1+q_2+\cdots+q_r \leqslant p_1+p_2+\cdots+p_r=n$

由定理1．10．2 知

$q_1+q_2+\cdots+q_r=n$

故得

$q_1=p_1, \quad q_2=p_2, \quad \cdots, \quad q_r=p_r$
推论若矩阵 $\boldsymbol{A}$ 的特征根全是单根，则 $\boldsymbol{A}$ 可对角化．
定理1．10．4 设 $n$ 阶矩阵 $\boldsymbol{A}$ 的谱为 $\left\{\lambda_1, \lambda_2, \cdots, \lambda_r\right\}$ ，特征值 $\lambda_i$ 的代数重复度为 $p_i(i=1,2, \cdots, r)$ ，则 $\boldsymbol{A}$ 与对角矩阵相似的充要条件是 $\lambda_i$ 的代数重复度 $p_i=$ $n-\operatorname{rank}\left(\lambda_i E-A\right) \quad(i=1,2, \cdots, r)$ ．

证明由定理1．10．3知 $\lambda_i$ 的代数重复度 $p_i$ 等于它的几何重复度 $q_i$ ，而 $\lambda_i$ 的几何重复度就是线性齐次方程组 $\left(\lambda_i \boldsymbol{E}-\boldsymbol{A}\right) x=0$ 的基础解系向量个数，即 $\lambda_i$ 的几何重复度等于 $n-\operatorname{rank}\left(\lambda_i \boldsymbol{E}-\boldsymbol{A}\right)$ 。

二，可交换情况 $\boldsymbol{A B}=\boldsymbol{B A}$
一般而言，若 $\boldsymbol{A}, \boldsymbol{B} \in C^{n \times n}$ ，未必能有

$A B = B A$

若 $\boldsymbol{A B}=\boldsymbol{B A}$ ，便称 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ （乘法）可交换．
定理1．10．5 若 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 乘法可交换，则 $\boldsymbol{A}$ 的任何特征子空间都是 $\boldsymbol{B}$ 的不变子空间。

注：定理1．10．5是定理1．9．2的另一种说法。并且可知， $\boldsymbol{B}$ 的任何特征子空间也是 $\boldsymbol{A}$ 的不变子空间。

定理1．10．6 若 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 乘法可交换，则 $\boldsymbol{A}$ 的任何特征子空间中都有 $\boldsymbol{B}$ 的特征向量。

证明设 $V_{\lambda_0}$ 是 $\boldsymbol{A}$ 的特征值为 $\lambda_0$ 的特征子空间， $\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_s$ 是 $V_{\lambda_0}$ 的一个基，由定理1．10．5知 $V_{\lambda_0}$ 是 $\boldsymbol{B}$ 的不变子空间。所以

$\boldsymbol{B} \boldsymbol{\alpha}_i=c_{1 i} \boldsymbol{\alpha}_1+c_{2 i} \boldsymbol{\alpha}_2+\cdots+c_{s i} \boldsymbol{\alpha}_s \quad(i=1,2, \cdots, s)$

命

$\boldsymbol{M}=\left[\begin{array}{cccc} c_{11} & c_{12} & \cdots & c_{1 s} \\ c_{21} & c_{22} & \cdots & c_{2 s} \\ \vdots & \vdots & & \vdots \\ c_{s 1} & c_{s 2} & \cdots & c_{s s} \end{array}\right]$

设 $\in V_{\lambda_0}$ ，则有

$\boldsymbol{X}=l_1 \boldsymbol{\alpha}_1+l_2 \boldsymbol{\alpha}_2+\cdots+l_s \boldsymbol{\alpha}_s$

欲使 $\boldsymbol{X}$ 是 $V_{\lambda 0}$ 的向量，只需 $\boldsymbol{X}=\boldsymbol{\mu} \boldsymbol{X}$ ．于是结合式（1．10．5）有

$\begin{aligned} \boldsymbol{B} \boldsymbol{X}= & l_1 \boldsymbol{B} \boldsymbol{\alpha}_1+l_2 \boldsymbol{B} \boldsymbol{\alpha}_2+\cdots+l_s \boldsymbol{B} \boldsymbol{\alpha}_s \\ = & \left(l_1 c_{11}+l_2 c_{12}+\cdots+l_s c_{1 s}\right) \boldsymbol{\alpha}_1+ \\ & \left(l_1 c_{21}+l_2 c_{22}+\cdots+l_s c_{2 s}\right) \boldsymbol{\alpha}_2+\cdots+ \\ & \left(l_1 c_{s 1}+l_2 c_{s 2}+\cdots+l_s c_{s s}\right) \boldsymbol{\alpha}_s \\ \mu \boldsymbol{X}= & \mu l_1 \boldsymbol{\alpha}_1+\mu l_2 \boldsymbol{\alpha}_2+\cdots+\mu l_s \boldsymbol{\alpha}_s \end{aligned}$
把 $\boldsymbol{B X}$ 与 $\mu \boldsymbol{X}$ 的表达式代人

$X=\mu X$

并根据 $\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_s$ 线性无关，得到 $l_1, l_2, \cdots, l_s$ 满足方程组

$\left\{\begin{array}{ccc} l_1\left(c_{11}-\mu\right)+l_2 c_{12} & +\cdots+l_s c_{1 s} & =0 \\ l_1 c_{21} & +l_2\left(c_{22}-\mu\right)+\cdots+l_s c_{2 s} & =0 \\ \vdots & \vdots & \vdots \\ l_1 c_{s 1} & +l_2 c_{s 2} & +\cdots+l_s\left(c_{s s}-\mu\right) \\ \vdots \end{array}\right.$

此即 $\left(l_1, l_2, \cdots, l_s\right)^{\mathrm{T}}$ 是 $s$ 阶矩阵 $\boldsymbol{M}$ 的特征向量，它总是存在的。因此在 $V_{\lambda_0}$ 中至少存在一组数 $l_1, l_2, \cdots, l_s$ 使得 $\boldsymbol{X}=l_1 \boldsymbol{\alpha}_1+l_2 \boldsymbol{\alpha}_2+\cdots+l_s \boldsymbol{\alpha}_s$ 满足式（1．10．8），即 $\boldsymbol{X}$ 是 $\boldsymbol{B}$ 的一个特征向量。

推论1．10．1 若 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 乘法可交换，则 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 必有公共的特征向量．
推论1．10．2 若 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 乘法可交换， $\lambda_1, \lambda_2, \cdots, \lambda_k$ 是 $\boldsymbol{A}$ 的 $k$ 个相异特征值，则 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 至少有 $k$ 个线性无关的公共特征向量．

三，同时对角化
引理1．10．1 设 $\boldsymbol{A} \in C^{n \times n}, \boldsymbol{B} \in C^{m \times m}$ ，且 $\boldsymbol{D}=\left[\begin{array}{ll}\boldsymbol{A} & 0 \\ 0 & \boldsymbol{B}\end{array}\right]$ ，则 $\boldsymbol{D}$ 可以对角化的充要条件是 $\boldsymbol{A}, \boldsymbol{B}$ 都可以对角化。

证明充分性若 $A, B$ 都可以对角化，存在 $S_1 \in C_n^{n \times n}, S_2 \in C_m^{m \times m}$ ，满足

$\begin{gathered} S_1^{-1} A S_1=\Lambda_1=\text { 对角形 } \\ S_2^{-1} B S_2=\boldsymbol{\Lambda}_2=\text { 对角形 } \\ S=\left[\begin{array}{cc} S_1 & 0 \\ 0 & S_2 \end{array}\right] \end{gathered}$

令

则

$\begin{aligned} S^{-1} D S & =\left[\begin{array}{cc} S_1^{-1} & 0 \\ 0 & S_2^{-1} \end{array}\right]\left[\begin{array}{cc} A & 0 \\ 0 & B \end{array}\right]\left[\begin{array}{cc} S_1 & 0 \\ 0 & S_2 \end{array}\right] \\ & =\left[\begin{array}{cc} S_1^{-1} A S_1 & 0 \\ 0 & S_2^{-1} B S_2 \end{array}\right]=\left[\begin{array}{cc} \Lambda_1 & 0 \\ 0 & \Lambda_2 \end{array}\right]=\boldsymbol{\Lambda}=\text { 对角形 } \end{aligned}$

必要性若 $\boldsymbol{D}$ 可以对角化，存在 $\in C_{n+m}^{(n+m) \times(n+m)}$ ，满足

$\begin{gathered} \boldsymbol{S}^{-1} \boldsymbol{D S}=\boldsymbol{\Lambda}=\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n, \lambda_{n+1}, \cdots, \lambda_{n+m}\right) \\ \text{命}\boldsymbol{S}=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n, \boldsymbol{\alpha}_{n+1}, \cdots, \boldsymbol{\alpha}_{n+m}\right) . \end{gathered}$

其中

$\boldsymbol{\alpha}_i=\left[\begin{array}{c} \boldsymbol{\xi}_i \\ \boldsymbol{\eta}_i \end{array}\right] \in C^{n+m}, \quad \boldsymbol{\xi}_i \in C^n, \quad \boldsymbol{\eta}_i \in C^m \quad(i=1,2, \cdots, n+m)$

因为 $\boldsymbol{D S}=\operatorname{Sdiag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n, \lambda_{n+1}, \cdots, \lambda_{n+m}\right)$ ，所以
$\begin{aligned} & \boldsymbol{D}\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n, \cdots, \boldsymbol{\alpha}_{n+m}\right) \\ = & \left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n, \cdots, \boldsymbol{\alpha}_{n+m}\right) \times\left[\begin{array}{llll} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \\ & \left(\lambda_1 \boldsymbol{\alpha}_1, \lambda_2 \boldsymbol{\alpha}_2, \cdots, \lambda_n \boldsymbol{\alpha}_n, \cdots, \lambda_{n+m} \boldsymbol{\alpha}_{n+m}\right) \end{array}\right] \end{aligned}$

比较上式两端得

$\boldsymbol{\alpha}_i=\lambda_i \boldsymbol{\alpha}_i \quad(i=1,2, \cdots, n+m)$

即

$\left[\begin{array}{cc} \boldsymbol{A} & 0 \\ \mathbf{0} & \boldsymbol{B} \end{array}\right]\left[\begin{array}{c} \boldsymbol{\xi}_i \\ \boldsymbol{\eta}_i \end{array}\right]=\lambda_i\left[\begin{array}{c} \xi_i \\ \boldsymbol{\eta}_i \end{array}\right] \quad(i=1,2, \cdots, n+m)$

比较上式两端得

$\boldsymbol{A} \boldsymbol{\xi}_i=\lambda_i \boldsymbol{\xi}_i, \boldsymbol{B} \boldsymbol{\eta}_i=\lambda_i \boldsymbol{\eta}_i \quad(i=1,2, \cdots, n+m)$

这说明 $\boldsymbol{\xi}_i$ 是 $\boldsymbol{A}$ 的特征向量， $\boldsymbol{\eta}_i$ 是 $\boldsymbol{B}$ 的特征向量．现在将要证明 $(n + m)$ 个 $\boldsymbol{\xi}_i$ 中仅有 $n$ 个是线性元关的， $(n + m)$ 个 $\boldsymbol{\eta}_i$ 中仅有 $m$ 个是线性无关的。

因为

$\boldsymbol{S}=\left[\begin{array}{cccccc} \boldsymbol{\xi}_1, & \boldsymbol{\xi}_2, & \cdots, & \boldsymbol{\xi}_n, & \cdots, & \boldsymbol{\xi}_{n+m} \\ \boldsymbol{\eta}_1, & \boldsymbol{\eta}_2, & \cdots, & \boldsymbol{\eta}_n, & \cdots, & \boldsymbol{\eta}_{n+m} \end{array}\right] \in C_{n+m}^{(n+m) \times(n+m)}$

所以 $\boldsymbol{S}$ 的 $(n + m)$ 个行向量线性无关，于是矩阵 $\left(\boldsymbol{\xi}_1, \boldsymbol{\xi}_2, \cdots, \boldsymbol{\xi}_n, \cdots, \boldsymbol{\xi}_{n+m}\right)$ $\in C^{n \times(n+m)}$ 的 $n$ 个行向量线性无关， $\left(\boldsymbol{\eta}_1, \boldsymbol{\eta}_2, \cdots, \boldsymbol{\eta}_n, \cdots, \boldsymbol{\eta}_{n+m}\right) \in C^{m \times(n+m)}$ 的 $m$ 个行向量线性无关。因此

$\begin{aligned} & \operatorname{rank}\left(\boldsymbol{\xi}_1, \boldsymbol{\xi}_2, \cdots, \boldsymbol{\xi}_n, \cdots, \boldsymbol{\xi}_{n+m}\right)=n \\ & \operatorname{rank}\left(\boldsymbol{\eta}_1, \boldsymbol{\eta}_2, \cdots, \boldsymbol{\eta}_n, \cdots, \boldsymbol{\eta}_{n+m}\right)=m \end{aligned}$

此即 $(n + m)$ 个 $\boldsymbol{\xi}_i$ 中仅有 $n$ 个线性无关， $(n + m)$ 个 $\eta_i$ 中仅有 $m$ 个线性无关。所以 $A, B$ 均可对角化。

定理1．10．7 设 $\boldsymbol{A}, \boldsymbol{B} \in C^{n \times n}$ 都可以对角化，则 $\boldsymbol{A}, \boldsymbol{B}$ 同时对角化的充要条件是 $\boldsymbol{A B}=\boldsymbol{B A}$ ．

证明必要性：若存在 $\boldsymbol{P} \in C_n^{n \times n}$ ，满足

$\begin{aligned} & \boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}=\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right) \\ & \boldsymbol{P}^{-1} \boldsymbol{B} \boldsymbol{P}=\operatorname{diag}\left(\mu_1, \mu_2, \cdots, \mu_n\right) \end{aligned}$

则

$\begin{aligned} \left(\boldsymbol{P}^{-1} \boldsymbol{A P}\right)\left(\boldsymbol{P}^{-1} \boldsymbol{B P}\right) & =\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right) \operatorname{diag}\left(\mu_1, \mu_2, \cdots, \mu_n\right) \\ & =\operatorname{diag}\left(\mu_1, \mu_2, \cdots, \mu_n\right) \operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right) \\ & =\left(\boldsymbol{P}^{-1} \boldsymbol{B} \boldsymbol{P}\right)\left(\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}\right) \end{aligned}$

此即
$A B = B A$

充分性：分两步论述。先假定 $\boldsymbol{A}$ 为对角形矩阵

$A=\left[\begin{array}{llll} \lambda_1 E_1 & & & \\ & \lambda_2 E_2 & & \\ & & \ddots & \\ & & & \lambda_h E_h \end{array}\right]$

其中 $E_i$ 是单位矩阵，其阶数为 $\lambda_i$ ．对 $\boldsymbol{B}$ 实施分块，其分法使之与 $\boldsymbol{A}$ 能相乘

$\boldsymbol{B}=\left[\begin{array}{cccc} \boldsymbol{B}_{11} & \boldsymbol{B}_{12} & \cdots & \boldsymbol{B}_{1 h} \\ \boldsymbol{B}_{21} & \boldsymbol{B}_{22} & \cdots & \boldsymbol{B}_{2 h} \\ \vdots & \vdots & & \vdots \\ \boldsymbol{B}_{h 1} & \boldsymbol{B}_{h 2} & \cdots & \boldsymbol{B}_{h h} \end{array}\right] \text {, }$

其中 $\boldsymbol{B}_{i j}$ 的行数与 $\boldsymbol{E}_i$ 阶数相同，列数与 $\boldsymbol{E}_j$ 的阶数相同．由于 $\boldsymbol{A B}=\boldsymbol{B A}$ ，所以 $\boldsymbol{B}_{i j}=0$ $\neq j)$ ，即

$\boldsymbol{B}=\left[\begin{array}{llll} \boldsymbol{B}_{11} & & & \\ & \boldsymbol{B}_{22} & & \\ & & \ddots & \\ & & & \boldsymbol{B}_{h h} \end{array}\right]$

其中 $\boldsymbol{B}_{i i}$ 均为方阵，由引理1．10．1知， $\boldsymbol{B}_{11}, \boldsymbol{B}_{22}, \cdots, \boldsymbol{B}_{h h}$ 都是可对角化矩阵．即存在满秩方阵 $\boldsymbol{T}_i$ ，使得 $\boldsymbol{T}_i^{-1} \boldsymbol{B}_{i i} \boldsymbol{T}_i$ 是对角形矩阵 $\cdots, h)$ 。命

$\boldsymbol{T}=\left[\begin{array}{llll} \boldsymbol{T}_1 & & & \\ & \boldsymbol{T}_2 & & \\ & & \ddots & \\ & & & \boldsymbol{T}_h \end{array}\right]$

则 $\boldsymbol{T}^{-1} \boldsymbol{A T}, \boldsymbol{T}^{-1} \boldsymbol{B} \boldsymbol{T}$ 均为对角形矩阵。
现设 $A$ 可以对角化，则存在 $\in C_n^{n \times n}$ ，满足

$\boldsymbol{S}^{-1} \boldsymbol{A} \boldsymbol{S}=\left[\begin{array}{llll} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{array}\right]=\widetilde{\boldsymbol{A}}$

且 $\boldsymbol{S}^{-1} \boldsymbol{B S}=\widetilde{\boldsymbol{B}}$ 也是可以对角化矩阵。根据 $\boldsymbol{A B}=\boldsymbol{B} \boldsymbol{A}$ ，可得 $\widetilde{\boldsymbol{A}} \widetilde{\boldsymbol{B}}=\widetilde{\boldsymbol{B}} \widetilde{\boldsymbol{A}}$ ．由前面论述知，对于 $\widetilde{\boldsymbol{A}}, \widetilde{\boldsymbol{B}}$ 可以同时对角化，即存在 $\boldsymbol{T} \in C_n^{n \times n}$ 满足

$T^{-1} \widetilde{A} T=\Lambda_1 \quad \text { 与 } \quad T^{-1} \widetilde{B} T=\Lambda_2$

所以

$T)^{-1} A(S T)=\Lambda_1 \quad \text { 与 } \quad(S T)^{-1} B(S T)=\Lambda_2$

此即 $A, B$ 可以同时对角化．

矩阵的相似对角化实现（MATLAB和C++）

MATLAB实现

1. 基本对角化

% 输入矩阵
A = [1 2 0; 0 2 0; -1 -2 1];

% 计算特征值和特征向量
[P, D] = eig(A);

% 验证对角化
disp('原始矩阵 A:');
disp(A);
disp('特征向量矩阵 P:');
disp(P);
disp('对角矩阵 D:');
disp(D);
disp('验证 P*D*inv(P):');
disp(P*D*inv(P));  % 应该等于A

% 检查条件数，判断数值稳定性
cond_P = cond(P);
disp(['矩阵P的条件数: ', num2str(cond_P)]);
if cond_P > 1e10
    warning('矩阵P接近奇异，对角化可能数值不稳定');
end

2. 处理不可对角化矩阵

A = [2 1; 0 2];  % Jordan块，不可对角化

[P, D] = eig(A);
if rank(P) < size(A,1)
    disp('矩阵不可对角化，尝试Jordan分解');
    [V, J] = jordan(A);  % 需要Symbolic Math Toolbox
    disp('Jordan标准形 J:');
    disp(J);
    disp('转换矩阵 V:');
    disp(V);
end

3. 对称矩阵的对角化（正交对角化）

A = [1 2; 2 1];  % 对称矩阵

% 对称矩阵总是可以对角化，且P是正交矩阵
[P, D] = eig(A);

% 验证正交性
disp('P的转置乘以P:');
disp(P'*P);  % 应该接近单位矩阵

C++实现（使用Eigen库）

1. 基本对角化

#include <iostream>
#include <Eigen/Eigenvalues>

using namespace Eigen;

void matrixDiagonalization(const MatrixXd& A) {
    // 计算特征分解
    EigenSolver<MatrixXd> es(A);
    MatrixXcd P = es.eigenvectors();
    MatrixXcd D = es.eigenvalues().asDiagonal();
    
    std::cout << "Original matrix A:\n" << A << "\n\n";
    std::cout << "Eigenvector matrix P:\n" << P << "\n\n";
    std::cout << "Diagonal matrix D:\n" << D << "\n\n";
    
    // 验证对角化
    MatrixXcd reconstruction = P * D * P.inverse();
    std::cout << "Verification P*D*P^(-1):\n" << reconstruction << "\n";
    std::cout << "Reconstruction error norm: " 
              << (reconstruction - A.cast<std::complex<double>>()).norm() 
              << "\n";
    
    // 检查是否可对角化
    FullPivLU<MatrixXcd> lu(P);
    if(lu.rank() < A.rows()) {
        std::cout << "Matrix is not diagonalizable (defective)\n";
    }
}

int main() {
    Matrix3d A;
    A << 1, 2, 0,
         0, 2, 0,
         -1, -2, 1;
         
    matrixDiagonalization(A);
    return 0;
}

2. 实数对称矩阵的对角化

#include <iostream>
#include <Eigen/Eigenvalues>

using namespace Eigen;

void symmetricDiagonalization(const MatrixXd& A) {
    // 确保输入是对称的
    if(!A.isApprox(A.transpose())) {
        std::cerr << "Matrix is not symmetric!\n";
        return;
    }
    
    // 使用SelfAdjointEigenSolver更高效
    SelfAdjointEigenSolver<MatrixXd> es(A);
    MatrixXd P = es.eigenvectors();
    MatrixXd D = es.eigenvalues().asDiagonal();
    
    std::cout << "Original matrix A:\n" << A << "\n\n";
    std::cout << "Orthogonal matrix P:\n" << P << "\n\n";
    std::cout << "Diagonal matrix D:\n" << D << "\n\n";
    
    // 验证正交性
    std::cout << "P' * P:\n" << P.transpose() * P << "\n";
    
    // 验证对角化
    MatrixXd reconstruction = P * D * P.transpose();
    std::cout << "Verification P*D*P':\n" << reconstruction << "\n";
    std::cout << "Reconstruction error norm: " 
              << (reconstruction - A).norm() << "\n";
}

int main() {
    Matrix2d A;
    A << 1, 2,
         2, 1;
         
    symmetricDiagonalization(A);
    return 0;
}

3. 处理不可对角化矩阵

#include <iostream>
#include <Eigen/Eigenvalues>

using namespace Eigen;

void checkDiagonalizability(const MatrixXd& A) {
    EigenSolver<MatrixXd> es(A);
    MatrixXcd P = es.eigenvectors();
    
    FullPivLU<MatrixXcd> lu(P);
    if(lu.rank() < A.rows()) {
        std::cout << "Matrix is not diagonalizable.\n";
        std::cout << "Attempting real Schur decomposition instead.\n";
        
        RealSchur<MatrixXd> schur(A);
        MatrixXd T = schur.matrixT();
        MatrixXd U = schur.matrixU();
        
        std::cout << "Quasi-triangular matrix T:\n" << T << "\n";
        std::cout << "Orthogonal matrix U:\n" << U << "\n";
    } else {
        std::cout << "Matrix is diagonalizable.\n";
    }
}

int main() {
    Matrix2d A;
    A << 2, 1,
         0, 2;  // Jordan块，不可对角化
         
    checkDiagonalizability(A);
    return 0;
}

应用实例

MATLAB应用：矩阵幂的计算

A = [1 2; 3 4];
[P, D] = eig(A);

% 计算A^5
A_pow_5 = P * (D^5) * inv(P);
disp('A^5:');
disp(A_pow_5);

C++应用：矩阵指数

Matrix2d A;
A << 1, 2,
     3, 4;
     
EigenSolver<MatrixXd> es(A);
MatrixXcd P = es.eigenvectors();
MatrixXcd D = es.eigenvalues().asDiagonal();

// 计算exp(A) = P * exp(D) * P^(-1)
MatrixXcd expD = D.array().exp().matrix().asDiagonal();
MatrixXcd expA = P * expD * P.inverse();

std::cout << "Matrix exponential exp(A):\n" << expA << "\n";

矩阵的相似对角形

1-10 矩阵的相似对角形

矩阵的相似对角化实现（MATLAB和C++）

MATLAB实现

1. 基本对角化

2. 处理不可对角化矩阵

3. 对称矩阵的对角化（正交对角化）

C++实现（使用Eigen库）

1. 基本对角化

2. 实数对称矩阵的对角化

3. 处理不可对角化矩阵

应用实例

MATLAB应用：矩阵幂的计算

C++应用：矩阵指数

网站公告

今日签到

热门文章

最新发布