【线性代数】线性方程组与矩阵——(1)线性方程组与矩阵初步

发布于:2025-08-10 ⋅ 阅读:(31) ⋅ 点赞:(0)

上一节:无
总目录【线性代数】目录

1. 线性方程组
  • 线性方程:形如 a 1 x 1 + a 2 x 2 + ⋯ + a n x n = b a_1x_1+a_2x_2+\dots+a_nx_n=b a1x1+a2x2++anxn=b的方程,其中 a i a_i ai为已知系数, x i x_i xi为未知数, b b b是常数项。未知数(也称为元)的个数可以限定描述线性方程,比如含2个未知数的线性方程称为二元线性方程。
  • 线性方程组:由多个线性方程组成的系统。 n n n m m m个方程的线性方程组可记作

{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 … … a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m (1.1) \begin{cases}\tag{1.1} a_{11}x_1+a_{12}x_2+\dots+a_{1n}x_n=b_1\\ a_{21}x_1+a_{22}x_2+\dots+a_{2n}x_n=b_2\\ \dots\dots\\ a_{m1}x_1+a_{m2}x_2+\dots+a_{mn}x_n=b_m\\ \end{cases} a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2……am1x1+am2x2++amnxn=bm(1.1)
其中 a i j a_{ij} aij是第 i i i个方程第 j j j个未知数的系数, b i b_i bi是第 i i i个方程的常数项, i = 1 , 2 , … , m ; j = 1 , 2 , … , n i=1,2,\dots,m;j=1,2,\dots,n i=1,2,,m;j=1,2,,n。当常数项 b 1 , b 2 , … , b m b_1,b_2,\dots,b_m b1,b2,,bm不全为0时,线性方程组 ( 1.1 ) (1.1) (1.1)称为 n n n元非齐次线性方程组;当 b 1 , b 2 , … , b m b_1,b_2,\dots,b_m b1,b2,,bm全为0时,线性方程组 ( 1.1 ) (1.1) (1.1)称为 n n n元齐次线性方程组。

2. 矩阵的引入

观察线性方程组 ( 1.1 ) (1.1) (1.1)可以发现,未知数 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn的取值,即线性方程组的解,由 m × n m\times n m×n个系数 a i j a_{ij} aij以及 m m m个常数项 b i b_i bi所构成的 m m m n + 1 n+1 n+1列的矩形数表所决定,由此引入矩阵的概念。

2.1. 矩阵的定义

m × n m\times n m×n个数 a i j ( i = 1 , 2 , … , m ; j = 1 , 2 , … , n ) a_{ij}(i=1,2,\dots,m;j=1,2,\dots,n) aij(i=1,2,,m;j=1,2,,n)排成 m m m n n n列的数表称为 m m m n n n列矩阵,简称 m × n m\times n m×n矩阵,记作

A = ( a 11 a 12 … a 1 n a 21 a 22 … a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 … a m n ) \mathbf{A}=\begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n}\\ a_{21} & a_{22} & \dots & a_{2n}\\ \vdots & \vdots & & \vdots\\ a_{m1} & a_{m2} & \dots & a_{mn}\\ \end{pmatrix} A= a11a21am1a12a22am2a1na2namn

a i j a_{ij} aij称为矩阵 A \mathbf{A} A i i i行第 j j j列的元素, m × n m\times n m×n矩阵 A \mathbf{A} A也记作 A m × n \mathbf{A}_{m\times n} Am×n

2.2. 常见的矩阵

元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵。

行数与列数都等于 n n n的矩阵称为 n n n阶矩阵或 n n n阶方阵, n n n阶矩阵 A n × n \mathbf{A}_{n\times n} An×n也可以记作 A n \mathbf{A}_n An

只有一行的矩阵

A = ( a 1 a 2 … a n ) \mathbf{A}=\begin{pmatrix} a_1 & a_2 &\dots&a_n \end{pmatrix} A=(a1a2an)

称为行向量,为避免写作时元素间的混淆,行向量也记作

A = ( a 1 , a 2 , … , a n ) \mathbf{A}=\begin{pmatrix} a_1, a_2 ,\dots,a_n \end{pmatrix} A=(a1,a2,,an)

只有一列的矩阵

A = ( a 1 a 2 ⋮ a n ) \mathbf{A}=\begin{pmatrix} a_1 \\ a_2 \\ \vdots\\ a_n \end{pmatrix} A= a1a2an

称为列向量。

两个矩阵的行数、列数都相等,则称它们是同型矩阵。如果两个矩阵 A , B \mathbf{A},\mathbf{B} A,B是同型矩阵,且对应元素相等,那么称两个矩阵相等,记作

A = B \mathbf{A}=\mathbf{B} A=B

元素都是0的矩阵称为零矩阵,记作 O \mathbf{O} O,注意不同型的零矩阵是不同的。

2.3. 线性方程组中常用的矩阵

对于非齐次线性方程组 ( 1.1 ) (1.1) (1.1)有如下几个有用的矩阵:

系数矩阵

A = ( a 11 a 12 … a 1 n a 21 a 22 … a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 … a m n ) \mathbf{A}=\begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n}\\ a_{21} & a_{22} & \dots & a_{2n}\\ \vdots & \vdots & & \vdots\\ a_{m1} & a_{m2} & \dots & a_{mn}\\ \end{pmatrix} A= a11a21am1a12a22am2a1na2namn

未知数矩阵

x = ( x 1 x 2 ⋮ x n ) \mathbf{x}=\begin{pmatrix} x_1 \\ x_2 \\ \vdots\\ x_n \end{pmatrix} x= x1x2xn

常数项矩阵

b = ( b 1 b 2 ⋮ b m ) \mathbf{b}=\begin{pmatrix} b_1 \\ b_2 \\ \vdots\\ b_m \end{pmatrix} b= b1b2bm

增广矩阵

B = ( a 11 a 12 … a 1 n b 1 a 21 a 22 … a 2 n b 2 ⋮ ⋮ ⋮ ⋮ a m 1 a m 2 … a m n b m ) \mathbf{B}=\begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n} & b_1\\ a_{21} & a_{22} & \dots & a_{2n} & b_2\\ \vdots & \vdots & & \vdots & \vdots\\ a_{m1} & a_{m2} & \dots & a_{mn} & b_m\\ \end{pmatrix} B= a11a21am1a12a22am2a1na2namnb1b2bm

2.4. 线性变换与矩阵

将非齐次线性方程组 ( 1.1 ) (1.1) (1.1)中的常数项替换为变量 y 1 , y 2 , … , y m y_1,y_2,\dots,y_m y1,y2,,ym,可以得到一个从变量 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn到变量 y 1 , y 2 , … , y m y_1,y_2,\dots,y_m y1,y2,,ym的线性变换

{ y 1 = a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n y 2 = a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n … … y m = a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n (2.1) \begin{cases}\tag{2.1} y_1=a_{11}x_1+a_{12}x_2+\dots+a_{1n}x_n\\ y_2=a_{21}x_1+a_{22}x_2+\dots+a_{2n}x_n\\ \dots\dots\\ y_m=a_{m1}x_1+a_{m2}x_2+\dots+a_{mn}x_n\\ \end{cases} y1=a11x1+a12x2++a1nxny2=a21x1+a22x2++a2nxn……ym=am1x1+am2x2++amnxn(2.1)

线性变换与其系数矩阵存在一一对应的关系。

各个维度单独的伸缩变换

{ y 1 = λ 1 x 1 y 2 = λ 2 x 2 … … y n = λ n x n \begin{cases} y_1=\lambda_1x_1\\ y_2=\lambda_2x_2\\ \dots\dots\\ y_n=\lambda_nx_n\\ \end{cases} y1=λ1x1y2=λ2x2……yn=λnxn

对应 n n n阶方阵

Λ = ( λ 1 0 … 0 0 λ 2 … 0 ⋮ ⋮ ⋮ 0 0 … λ n ) \mathbf{\Lambda}=\begin{pmatrix} \lambda_1 & 0 & \dots & 0\\ 0 & \lambda_2 & \dots & 0\\ \vdots & \vdots & & \vdots\\ 0 & 0 & \dots & \lambda_n\\ \end{pmatrix} Λ= λ1000λ2000λn

这种方阵从左上角到右下角的的直线(即对角线)以外的元素都为0,称为对角矩阵,记作

Λ = d i a g ( λ 1 , λ 2 , … , λ n ) \mathbf{\Lambda}=\mathrm{diag}\begin{pmatrix} \lambda_1,\lambda_2,\dots,\lambda_n \end{pmatrix} Λ=diag(λ1,λ2,,λn)

特别地,当 λ 1 = λ 2 = ⋯ = λ n = 1 \lambda_1=\lambda_2=\dots=\lambda_n=1 λ1=λ2==λn=1时的线性变换称为恒等变换,对应的 n n n阶方阵

E = ( 1 0 … 0 0 1 … 0 ⋮ ⋮ ⋮ 0 0 … 1 ) \mathbf{E}=\begin{pmatrix} 1 & 0 & \dots & 0\\ 0 & 1 & \dots & 0\\ \vdots & \vdots & & \vdots\\ 0 & 0 & \dots & 1\\ \end{pmatrix} E= 100010001

称为 n n n阶单位矩阵。

3. 矩阵的运算
3.1. 矩阵的加法
  • 当矩阵 A \mathrm{A} A B \mathrm{B} B是同型矩阵时, A + B \mathrm{A}+\mathrm{B} A+B规定为对应元素相加
  • 运算律
    • A + B = B + A \mathrm{A+B=B+A} A+B=B+A
    • ( A + B ) + C = A + ( B + C ) \mathrm{(A+B)+C=A+(B+C)} (A+B)+C=A+(B+C)
  • 负矩阵:矩阵所有元素取相反数
    • A + ( − A ) = O \mathrm{A+(-A)=O} A+(A)=O
    • 矩阵的减法: A − B = A + ( − B ) \mathrm{A-B=A+(-B)} AB=A+(B)
3.2. 矩阵的数乘
  • λ \lambda λ与矩阵 A \mathrm{A} A的乘积规定为矩阵 A \mathrm{A} A的所有元素与数 λ \lambda λ相乘
  • 运算律
    • ( λ μ ) A = λ ( μ A ) (\lambda \mu)\mathrm{A}=\lambda(\mu\mathrm{A}) (λμ)A=λ(μA)
    • ( λ + μ ) A = λ A + μ A (\lambda+\mu)\mathrm{A}=\lambda\mathrm{A}+\mu\mathrm{A} (λ+μ)A=λA+μA
    • λ ( A + B ) = λ A + λ B \lambda(\mathrm{A+B})=\lambda\mathrm{A}+\lambda\mathrm{B} λ(A+B)=λA+λB
  • 矩阵加法与数乘运算统称为矩阵的线性运算
3.3. 矩阵的乘法

已知从 t 1 , t 2 t_1,t_2 t1,t2 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3的线性变换,以及从 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3 y 1 , y 2 y_1,y_2 y1,y2的线性变换:

{ y 1 = a 11 x 1 + a 12 x 2 + a 13 x 3 y 2 = a 21 x 1 + a 22 x 2 + a 23 x 3 (3.3.1) \begin{cases}\tag{3.3.1} y_1=a_{11}x_1+a_{12}x_2+a_{13}x_3\\ y_2=a_{21}x_1+a_{22}x_2+a_{23}x_3\\ \end{cases}\\ {y1=a11x1+a12x2+a13x3y2=a21x1+a22x2+a23x3(3.3.1)

{ x 1 = b 11 t 1 + b 12 t 2 x 2 = b 21 t 1 + b 22 t 2 x 3 = b 31 t 1 + b 32 t 2 (3.3.2) \begin{cases}\tag{3.3.2} x_1=b_{11}t_1+b_{12}t_2\\ x_2=b_{21}t_1+b_{22}t_2\\ x_3=b_{31}t_1+b_{32}t_2\\ \end{cases} x1=b11t1+b12t2x2=b21t1+b22t2x3=b31t1+b32t2(3.3.2)

( 3.3.2 ) (3.3.2) (3.3.2)代入 ( 3.3.1 ) (3.3.1) (3.3.1)可以得到从 t 1 , t 2 t_1,t_2 t1,t2 y 1 , y 2 y_1,y_2 y1,y2的线性变换:

{ y 1 = ( a 11 b 11 + a 12 b 21 + a 13 b 31 ) t 1 + ( a 11 b 12 + a 12 b 22 + a 13 b 32 ) t 2 y 2 = ( a 21 b 11 + a 22 b 21 + a 23 b 31 ) t 1 + ( a 21 b 12 + a 22 b 22 + a 23 b 32 ) t 2 (3.3.3) \begin{cases}\tag{3.3.3} y_1=(a_{11}b_{11}+a_{12}b_{21}+a_{13}b_{31})t_1+(a_{11}b_{12}+a_{12}b_{22}+a_{13}b_{32})t_2\\ y_2=(a_{21}b_{11}+a_{22}b_{21}+a_{23}b_{31})t_1+(a_{21}b_{12}+a_{22}b_{22}+a_{23}b_{32})t_2\\ \end{cases} {y1=(a11b11+a12b21+a13b31)t1+(a11b12+a12b22+a13b32)t2y2=(a21b11+a22b21+a23b31)t1+(a21b12+a22b22+a23b32)t2(3.3.3)

线性变换 ( 3.3.3 ) (3.3.3) (3.3.3)称为线性变换 ( 3.3.1 ) (3.3.1) (3.3.1)与线性变换 ( 3.3.2 ) (3.3.2) (3.3.2)的乘积,由于线性变换与其系数矩阵存在一一对应的关系,因此可以定义矩阵的乘法:

( a 11 a 12 a 13 a 21 a 22 a 23 ) ( b 11 b 12 b 21 b 22 b 31 b 32 ) = ( a 11 b 11 + a 12 b 21 + a 13 b 31 a 11 b 12 + a 12 b 22 + a 13 b 32 a 21 b 11 + a 22 b 21 + a 23 b 31 a 21 b 12 + a 22 b 22 + a 23 b 32 ) \begin{pmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ \end{pmatrix}\begin{pmatrix} b_{11} & b_{12}\\ b_{21} & b_{22}\\ b_{31} & b_{32}\\ \end{pmatrix}=\begin{pmatrix} a_{11}b_{11}+a_{12}b_{21}+a_{13}b_{31} & a_{11}b_{12}+a_{12}b_{22}+a_{13}b_{32}\\ a_{21}b_{11}+a_{22}b_{21}+a_{23}b_{31} & a_{21}b_{12}+a_{22}b_{22}+a_{23}b_{32}\\ \end{pmatrix} (a11a21a12a22a13a23) b11b21b31b12b22b32 =(a11b11+a12b21+a13b31a21b11+a22b21+a23b31a11b12+a12b22+a13b32a21b12+a22b22+a23b32)

  • 矩阵乘法的定义:设 A = ( a i j ) \mathrm{A}=(a_{ij}) A=(aij)是一个 m × s m\times s m×s矩阵, B = ( b i j ) \mathrm{B}=(b_{ij}) B=(bij)是一个 s × n s\times n s×n矩阵,那么 A \mathrm{A} A B \mathrm{B} B的乘积是一个 m × n m\times n m×n矩阵 C = ( c i j ) \mathrm{C}=(c_{ij}) C=(cij),其中

    c i j = ∑ k = 1 s a i k b k j ( i = 1 , 2 , … , m ; j = 1 , 2 , … , n ) c_{ij}=\sum_{k=1}^sa_{ik}b_{kj}\\(i=1,2,\dots,m;j=1,2,\dots,n) cij=k=1saikbkj(i=1,2,,m;j=1,2,,n)

    并把此乘积记作 C = A B \mathrm{C=AB} C=AB

  • 矩阵乘法的要求:左矩阵 A \mathrm{A} A的列数必须与右矩阵 B \mathrm{B} B的行数相等,两个矩阵才能相乘。因此矩阵乘法必须注意相乘的顺序, A B \mathrm{AB} AB A \mathrm{A} A左乘 B \mathrm{B} B B A \mathrm{BA} BA A \mathrm{A} A右乘 B \mathrm{B} B A B \mathrm{AB} AB有意义时, B A \mathrm{BA} BA不一定有意义。

  • 矩阵乘法运算律

    • 矩阵乘法不满足交换律:一般情形下, A B ≠ B A \mathrm{AB}\neq\mathrm{BA} AB=BA。若 A B = B A \mathrm{AB=BA} AB=BA,则称方阵 A \mathrm{A} A B \mathrm{B} B是可交换的。
    • 矩阵乘法不满足消除律:若 A B = O \mathrm{AB=O} AB=O,不能得出 A = O \mathrm{A=O} A=O B = O \mathrm{B=O} B=O
    • 矩阵乘法满足结合律
      • ( A B ) C = A ( B C ) \mathrm{(AB)C=A(BC)} (AB)C=A(BC)
      • λ ( A B ) = ( λ A ) B = A ( λ B ) \lambda(\mathrm{AB})=(\lambda\mathrm{A})\mathrm{B}=\mathrm{A}(\lambda\mathrm{B}) λ(AB)=(λA)B=A(λB)
    • 矩阵乘法满足分配律
      • A ( B + C ) = A B + A C \mathrm{A}(B+C)=\mathrm{AB}+\mathrm{AC} A(B+C)=AB+AC
      • ( B + C ) A = B A + C A (B+C)\mathrm{A}=\mathrm{BA}+\mathrm{CA} (B+C)A=BA+CA
    • 单位矩阵与矩阵的乘法: A E = A = E A \mathrm{AE}=A=\mathrm{EA} AE=A=EA
  • 矩阵的幂:设 A \mathrm{A} A n n n阶方阵,定义 A 1 = A , A 2 = A 1 A 1 , … , A n = A n − 1 A \mathrm{A^1=A,A^2=A^1A^1,\dots,A^n=A^{n-1}A} A1=A,A2=A1A1,,An=An1A

  • 矩阵幂的运算律:

    • A m + n = A m A n \mathrm{A^{m+n}=A^m A^n} Am+n=AmAn
    • A m n = ( A m ) n \mathrm{A^{mn}=(A^m)^n} Amn=(Am)n
    • 一般情形下, ( A B ) n ≠ A n B n \mathrm{(AB)^n}\neq\mathrm{A^n B^n} (AB)n=AnBn,只有当 A \mathrm{A} A B \mathrm{B} B可交换时, ( A B ) n = A n B n \mathrm{(AB)^n=A^n B^n} (AB)n=AnBn成立。类似的 ( A + B ) 2 = A 2 + 2 A B + B 2 , ( A − B ) ( A + B ) = A 2 − B 2 \mathrm{(A+B)^2= A^2+2AB+B^2,(A-B)(A+B)=A^2-B^2} (A+B)2=A2+2AB+B2,(AB)(A+B)=A2B2等公式,只有当 A \mathrm{A} A B \mathrm{B} B可交换时才成立。
  • 利用矩阵乘法可以简化线性方程组和线性变换的表达。比如 n n n元非齐次线性方程组 ( 1.1 ) (1.1) (1.1)可以表示为矩阵方程 A m × n x n × 1 = b m × 1 \mathrm{A_{m\times n}x_{n\times 1}=b_{m\times 1}} Am×nxn×1=bm×1,线性变换 ( 2.1 ) (2.1) (2.1)可以表示为矩阵方程 y = A x \mathrm{y=Ax} y=Ax

3.4. 矩阵的转置
  • A = ( a i j ) \mathrm{A}=(a_{ij}) A=(aij)是一个 m × n m\times n m×n矩阵,将 A \mathrm{A} A的行与列互换,得到一个 n × m n\times m n×m矩阵,称为 A \mathrm{A} A的转置矩阵,记作 A T = ( a j i ) \mathrm{A^T}=(a_{ji}) AT=(aji),其中 a j i = a i j a_{ji}=a_{ij} aji=aij
  • 运算律(假设运算都是可行的)
    • ( A T ) T = A (\mathrm{A}^T)^T=\mathrm{A} (AT)T=A
    • ( A + B ) T = A T + B T (\mathrm{A}+\mathrm{B})^T=\mathrm{A}^T+\mathrm{B}^T (A+B)T=AT+BT
    • ( λ A ) T = λ A T (\lambda\mathrm{A})^T=\lambda\mathrm{A}^T (λA)T=λAT
    • ( A B ) T = B T A T (\mathrm{AB})^T=\mathrm{B}^T\mathrm{A}^T (AB)T=BTAT
  • A \mathrm{A} A n n n阶方阵,如果满足 A T = A \mathrm{A}^T=\mathrm{A} AT=A,那么称 A \mathrm{A} A为对称矩阵。对称矩阵的元素以主对角线为轴对应相等。
3.5. 方阵的行列式
  • 行列式的引入、性质和定理参见【线性代数】线性方程组与矩阵——行列式
  • 行列式的运算律
    • ∣ A T ∣ = ∣ A ∣ \mathrm{|A^T|=|A|} AT=∣A∣
    • ∣ λ A ∣ = λ n ∣ A ∣ \mathrm{|\lambda A|=\lambda^n|A|} λA∣=λn∣A∣
    • ∣ A B ∣ = ∣ A ∣ ∣ B ∣ \mathrm{|AB|=|A||B|} ∣AB∣=∣A∣∣B∣
      • ∣ A ∣ ∣ B ∣ = ∣ A O − E B ∣ = ∣ A A B − E O ∣ = ( − 1 ) n ∣ − E O A A B ∣ = ∣ A B ∣ \mathrm{|A||B|=\begin{vmatrix}A&O\\-E&B\end{vmatrix}=\begin{vmatrix}A&AB\\-E&O\end{vmatrix}=(-1)^n\begin{vmatrix}-E&O\\ A&AB\end{vmatrix}=|AB|} ∣A∣∣B∣= AEOB = AEABO =(1)n EAOAB =∣AB∣
  • 将行列式 ∣ A ∣ |\mathrm{A}| A 中的各个元素的代数余子式 A i j A_{ij} Aij 构成如下的矩阵:
    A ∗ = ( A 11 A 12 … A 1 n A 21 A 22 … A 2 n ⋮ ⋮ ⋮ A n 1 A n 2 … A n n ) \mathrm{A^*}=\begin{pmatrix} A_{11} & A_{12} & \dots & A_{1n}\\ A_{21} & A_{22} & \dots & A_{2n}\\ \vdots & \vdots & & \vdots\\ A_{n1} & A_{n2} & \dots & A_{nn}\\ \end{pmatrix} A= A11A21An1A12A22An2A1nA2nAnn
    称为矩阵 A \mathrm{A} A 的伴随矩阵。
  • 伴随矩阵的性质: A A ∗ = A ∗ A = ∣ A ∣ E \mathrm{AA^*=A^*A=|A|E} AA=AA=∣A∣E。利用了行列式展开定理, ∑ k = 1 n a i k A j k = { ∣ A ∣ , i = j 0 , i ≠ j \sum\limits_{k=1}^n a_{ik}A_{jk}=\begin{cases}|\mathrm{A}|, &i=j\\0, &i\ne j\end{cases} k=1naikAjk={A,0,i=ji=j A A ∗ = A ∗ A = ( ∣ A ∣ ∣ A ∣ ⋱ ∣ A ∣ ) = ∣ A ∣ E \mathrm{AA^*=A^*A}=\begin{pmatrix}\mathrm{|A|}\\ &\mathrm{|A|}\\ &&\ddots\\ &&&\mathrm{|A|}\end{pmatrix}=\mathrm{|A|E} AA=AA= ∣A∣∣A∣∣A∣ =∣A∣E
  • 伴随矩阵的运算律
    • ( A B ) ∗ = B ∗ A ∗ \mathrm{(AB)^*=B^*A^*} (AB)=BA
3.6 逆矩阵
  • 对于 n n n 阶矩阵 A \mathrm{A} A,如果存在一个 n n n 阶矩阵 B \mathrm{B} B,使得 A B = B A = E \mathrm{AB=BA=E} AB=BA=E,那么称矩阵 A \mathrm{A} A 是可逆的,并把 B \mathrm{B} B 称为 A \mathrm{A} A 的逆矩阵,记作 A − 1 \mathrm{A}^{-1} A1
    • 如果 A \mathrm{A} A 是可逆的,那么 A \mathrm{A} A 的逆矩阵是唯一的。先假设 B , C \mathrm{B,C} B,C 都是 A \mathrm{A} A 的逆矩阵,然后证明 B , C \mathrm{B,C} B,C 相等。
  • 若矩阵 A \mathrm{A} A 是可逆的,那么 ∣ A ∣ ≠ 0 \mathrm{|A|}\ne 0 ∣A∣=0。因为 ∣ A ∣ ∣ A − 1 ∣ = ∣ A − 1 A ∣ = ∣ E ∣ = 1 \mathrm{|A|}\mathrm{|A^{-1}|}=|\mathrm{A^{-1}A}|=|E|=1 ∣A∣A1=A1A=E=1,所以 ∣ A ∣ ≠ 0 \mathrm{|A|}\ne 0 ∣A∣=0
  • ∣ A ∣ ≠ 0 \mathrm{|A|} \ne 0 ∣A∣=0,则矩阵 A \mathrm{A} A 是可逆的,且 A − 1 = 1 ∣ A ∣ A ∗ \mathrm{A^{-1}}=\frac{1}{\mathrm{|A|}}\mathrm{A^*} A1=∣A∣1A。如果 ∣ A ∣ ≠ 0 \mathrm{|A|} \ne 0 ∣A∣=0,根据伴随矩阵的性质,可以找到符合条件的唯一的逆矩阵。
  • ∣ A ∣ = 0 \mathrm{|A|} = 0 ∣A∣=0时, A \mathrm{A} A 称为奇异矩阵,否则称为非奇异矩阵。因此,可逆矩阵就是非奇异矩阵。
  • A B = E \mathrm{AB=E} AB=E (或 B A = E \mathrm{BA=E} BA=E),则 B = A − 1 \mathrm{B=A^{-1}} B=A1。只需逆矩阵定义的一半条件,就能推导出逆矩阵。因为 A B = E \mathrm{AB=E} AB=E (或 B A = E \mathrm{BA=E} BA=E)可以得到 ∣ A ∣ ∣ B ∣ = 1 \mathrm{|A||B|}=1 ∣A∣∣B∣=1,即 ∣ A ∣ ≠ 0 \mathrm{|A|}\ne 0 ∣A∣=0
  • 逆矩阵的运算律
    • A \mathrm{A} A 可逆,则 A − 1 \mathrm{A^{-1}} A1 可逆,且 ( A − 1 ) − 1 = A (\mathrm{A^{-1}})^{-1}=\mathrm{A} (A1)1=A。将 A \mathrm{A} A A − 1 \mathrm{A^{-1}} A1 换位思考。
    • A \mathrm{A} A 可逆,数 λ ≠ 0 \lambda\ne 0 λ=0,则 λ A \lambda\mathrm{A} λA 可逆,且 ( λ A ) − 1 = 1 λ A − 1 (\lambda\mathrm{A})^{-1}=\frac{1}{\lambda}\mathrm{A^{-1}} (λA)1=λ1A1。常数不会影响可逆性。
    • A , B \mathrm{A,B} A,B 为同阶矩阵且均可逆,则 A B \mathrm{AB} AB 亦可逆,且 ( A B ) − 1 = B − 1 A − 1 (\mathrm{AB})^{-1}=\mathrm{B^{-1}}\mathrm{A^{-1}} (AB)1=B1A1 ∣ A B ∣ ≠ 0 \mathrm{|AB|}\ne 0 ∣AB∣=0
    • A \mathrm{A} A 可逆,则 A T \mathrm{A^T} AT 亦可逆,且 ( A T ) − 1 = ( A − 1 ) T (\mathrm{A^T})^{-1}=(\mathrm{A^{-1}})^T (AT)1=(A1)T ∣ A T ∣ = ∣ A ∣ ≠ 0 \mathrm{|A^T|}=\mathrm{|A|}\ne 0 AT=∣A∣=0
    • A \mathrm{A} A 可逆,则 A ∗ \mathrm{A^*} A 亦可逆,且 ( A ∗ ) − 1 = ( A − 1 ) ∗ (\mathrm{A^*})^{-1}=(\mathrm{A^{-1}})^* (A)1=(A1) ∣ A A ∗ ∣ = ∣ A ∣ n \mathrm{|AA^*|=|A|^n} ∣AA=∣An
  • φ ( x ) = a 0 + a 1 x + ⋯ + a m x m \varphi(x)=a_0+a_1x+\dots+a_mx^m φ(x)=a0+a1x++amxm A \mathrm{A} A n n n 阶矩阵,记 φ ( A ) = a 0 E + a 1 A + ⋯ + a m A m \varphi(\mathrm{A})=a_0\mathrm{E}+a_1\mathrm{A}+\dots+a_m\mathrm{A}^m φ(A)=a0E+a1A++amAm,则 φ ( A ) \varphi(\mathrm{A}) φ(A) 称为矩阵 A \mathrm{A} A m m m 次多项式。
    • 矩阵 A \mathrm{A} A 的两个多项式 φ ( A ) \varphi(\mathrm{A}) φ(A) f ( A ) f(\mathrm{A}) f(A) 是可交换的,即 φ ( A ) f ( A ) = f ( A ) φ ( A ) \varphi(\mathrm{A})f(\mathrm{A})=f(\mathrm{A})\varphi(\mathrm{A}) φ(A)f(A)=f(A)φ(A)。因此可以像数的多项式一样相乘和分解因式。
    • 如果 A = P Λ P − 1 \mathrm{A=P\Lambda P^{-1}} A=P1,则 A k = P Λ k P − 1 \mathrm{A^k=P\Lambda^kP^{-1}} Ak=PΛkP1,从而 φ ( A ) = P φ ( Λ ) P − 1 \varphi(\mathrm{A})=\mathrm{P}\varphi(\mathrm{\Lambda})\mathrm{P}^{-1} φ(A)=Pφ(Λ)P1
    • 如果 Λ = d i a g ( λ 1 , λ 2 , … , λ n ) \mathrm{\Lambda} = \mathrm{diag}(\lambda_1,\lambda_2,\dots,\lambda_n) Λ=diag(λ1,λ2,,λn),则 Λ k = d i a g ( λ 1 k , λ 2 k , … , λ n k ) \mathrm{\Lambda}^k=\mathrm{diag}(\lambda_1^k,\lambda_2^k,\dots,\lambda_n^k) Λk=diag(λ1k,λ2k,,λnk),从而 φ ( Λ ) = d i a g ( φ ( λ 1 ) , φ ( λ 2 ) , … , φ ( λ n ) ) \varphi(\mathrm{\Lambda})=\mathrm{diag}(\varphi(\lambda_1),\varphi(\lambda_2),\dots,\varphi(\lambda_n)) φ(Λ)=diag(φ(λ1),φ(λ2),,φ(λn))

下一节【线性代数】线性方程组与矩阵——(2)矩阵与线性方程组的解
总目录【线性代数】目录