【线性代数】其他

发布于:2025-08-10 ⋅ 阅读:(18) ⋅ 点赞:(0)

上一节【线性代数】线性方程组与矩阵——(3)线性方程组解的结构
总目录【线性代数】目录

11. 向量的内积、长度及正交性
  • 设有 n n n 维向量 x = ( x 1 x 2 ⋮ x n ) , y = ( y 1 y 2 ⋮ y n ) \mathrm{x}=\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}, \mathrm{y}=\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix} x= x1x2xn ,y= y1y2yn ,令 [ x , y ] = x 1 y 1 + x 2 y 2 + ⋯ + x n y n = x T y \mathrm{[x,y]=x_1y_1+x_2y_2+\dots+x_ny_n}=\mathrm{x^Ty} [x,y]=x1y1+x2y2++xnyn=xTy,则 [ x , y ] \mathrm{[x,y]} [x,y] 称为向量 x \mathrm{x} x y \mathrm{y} y 的内积。
  • 内积的性质
    • [ x , y ] = [ y , x ] \mathrm{[x,y]=\mathrm{[y,x]}} [x,y]=[y,x]
    • [ λ x , y ] = λ [ x , y ] \mathrm{[\lambda x,y]=\lambda\mathrm{[x,y]}} [λx,y]=λ[x,y]
    • [ x + y , z ] = [ x , z ] + [ y , z ] \mathrm{[x+y,z]=\mathrm{[x,z]}+\mathrm{[y,z]}} [x+y,z]=[x,z]+[y,z]
    • [ x , x ] ≥ 0 \mathrm{[x,x]\geq 0} [x,x]0,且 [ x , x ] = 0 \mathrm{[x,x]=0} [x,x]=0 当且仅当 x = 0 \mathrm{x=0} x=0
  • 施瓦茨不等式: [ x , y ] 2 ≤ [ x , x ] [ y , y ] \mathrm{[x,y]^2\leq [x,x][y,y]} [x,y]2[x,x][y,y]
  • ∣ ∣ x ∣ ∣ = [ x , x ] \mathrm{||x||=\sqrt{[x,x]}} ∣∣x∣∣=[x,x] ,则 ∣ ∣ x ∣ ∣ \mathrm{||x||} ∣∣x∣∣ 称为向量 x \mathrm{x} x 的长度或范数。
  • 向量长度的性质
    • 非负性: ∣ ∣ x ∣ ∣ ≥ 0 \mathrm{||x||\geq 0} ∣∣x∣∣0,且 ∣ ∣ x ∣ ∣ = 0 \mathrm{||x||=0} ∣∣x∣∣=0 当且仅当 x = 0 \mathrm{x=0} x=0
    • 齐次性: ∣ ∣ λ x ∣ ∣ = ∣ λ ∣ ∣ ∣ x ∣ ∣ \mathrm{||\lambda x||=|\lambda|\mathrm{||x||}} ∣∣λx∣∣=λ∣∣x∣∣
  • ∣ ∣ x ∣ ∣ = 1 \mathrm{||x||}=1 ∣∣x∣∣=1 时,称 x \mathrm{x} x 为单位向量,若 a ≠ 0 \mathrm{a\ne 0} a=0,取 x = a ∣ ∣ a ∣ ∣ \mathrm{x=\dfrac{a}{||a||}} x=∣∣a∣∣a,则 x \mathrm{x} x 是一个单位向量,由向量 a \mathrm{a} a 得到 x \mathrm{x} x 的过程称为把向量 a \mathrm{a} a 单位化。
  • 由施瓦茨不等式,有 − 1 ≤ [ x , y ] ∣ ∣ x ∣ ∣ ⋅ ∣ ∣ y ∣ ∣ ≤ 1 -1\le \mathrm{\dfrac{[x,y]}{||x||\cdot||y||}}\le 1 1∣∣x∣∣∣∣y∣∣[x,y]1(当 ∥ x ∥ ∥ y ∥ ≠ 0 \mathrm{\|x\|\|y\|}\ne 0 ∥x∥∥y∥=0 时)。当 x ≠ 0 , y ≠ 0 \mathrm{x\ne 0,y\ne 0} x=0,y=0 时,令 θ = arccos ⁡ [ x , y ] ∣ ∣ x ∣ ∣ ⋅ ∣ ∣ y ∣ ∣ \mathrm{\theta=\arccos\dfrac{[x,y]}{||x||\cdot||y||}} θ=arccos∣∣x∣∣∣∣y∣∣[x,y],则 θ \mathrm{\theta} θ 称为向量 x \mathrm{x} x y \mathrm{y} y 的夹角。当 [ x , y ] = 0 \mathrm{[x,y]}=0 [x,y]=0 时,称 x \mathrm{x} x y \mathrm{y} y 正交;若 x = 0 \mathrm{x=0} x=0,则 x \mathrm{x} x 与任何向量都正交。
  • 向量 a \mathrm{a} a b 1 , … , b n \mathrm{b_1,\dots,b_n} b1,,bn 正交,则 a \mathrm{a} a b 1 , … , b n \mathrm{b_1,\dots,b_n} b1,,bn 的线性组合也正交。
  • 向量 x \mathrm{x} x y \mathrm{y} y 方向上的投影向量为 [ x , y ∥ y ∥ ] y ∥ y ∥ = [ x , y ] [ y , y ] y \mathrm{[x,\dfrac{y}{\|y\|}]\dfrac{y}{\|y\|}=\dfrac{[x,y]}{[y,y]}y} [x,∥y∥y]∥y∥y=[y,y][x,y]y
  • n n n 维向量 a 1 , a 2 , … , a n \mathrm{a_1,a_2,\dots,a_n} a1,a2,,an 是一组两两正交的非零向量,则 a 1 , a 2 , … , a n \mathrm{a_1,a_2,\dots,a_n} a1,a2,,an 线性无关。
    • 假设有 k 1 , k 2 , … , k n k_1,k_2,\dots,k_n k1,k2,,kn,使 k 1 a 1 + ⋯ + k n a n = 0 k_1\mathrm{a_1}+\dots+k_n\mathrm{a_n=0} k1a1++knan=0
    • a 1 \mathrm{a_1} a1 与上式两端作内积,得 k 1 [ a 1 , a 1 ] = 0 \mathrm{k_1[a_1,a_1]=0} k1[a1,a1]=0,即 k 1 = 0 \mathrm{k_1=0} k1=0,同理可得 k 2 = ⋯ = k n = 0 \mathrm{k_2=\dots=k_n=0} k2==kn=0,即 a 1 , a 2 , … , a n \mathrm{a_1,a_2,\dots,a_n} a1,a2,,an 线性无关。
  • n n n 维向量 e 1 , … , e r \mathrm{e_1,\dots,e_r} e1,,er 是向量空间 V ⊆ R n V\subseteq\mathbb{R}^n VRn 的一个基,若 e 1 , … , e r \mathrm{e_1,\dots,e_r} e1,,er 两两正交,且都是单位向量,则称 e 1 , … , e r \mathrm{e_1,\dots,e_r} e1,,er V V V 的一个标准正交基。 a = λ 1 e 1 + ⋯ + λ r e r \mathrm{a=\lambda_1e_1+\dots+\lambda_re_r} a=λ1e1++λrer,为求 λ 1 , … , λ r \mathrm{\lambda_1,\dots,\lambda_r} λ1,,λr,只需将 a \mathrm{a} a e 1 , … , e r \mathrm{e_1,\dots,e_r} e1,,er 分别作内积,即 λ i = [ e i , a ] \lambda_i=[\mathrm{e_i, a}] λi=[ei,a]
  • a 1 , … , a r \mathrm{a_1,\dots,a_r} a1,,ar 是向量空间 V V V 的一个基,要求 V V V 的一个标准正交基,这个问题称为把基 a 1 , … , a r \mathrm{a_1,\dots,a_r} a1,,ar 标准正交化。
  • 施密特正交化:
    • b 1 = a 1 , b 2 = a 2 − [ b 1 , a 2 ] [ b 1 , b 1 ] b 1 , … , b r = a r − [ b 1 , a r ] [ b 1 , b 1 ] b 1 − [ b 2 , a r ] [ b 2 , b 2 ] b 2 − ⋯ − [ b r − 1 , a r ] [ b r − 1 , b r − 1 ] b r − 1 \mathrm{b_1=a_1},\mathrm{b_2=a_2-\dfrac{[b_1,a_2]}{[b_1,b_1]}b_1},\dots,\mathrm{b_r=a_r-\dfrac{[b_1,a_r]}{[b_1,b_1]}b_1-\dfrac{[b_2,a_r]}{[b_2,b_2]}b_2-\dots-\dfrac{[b_{r-1},a_r]}{[b_{r-1},b_{r-1}]}b_{r-1}} b1=a1,b2=a2[b1,b1][b1,a2]b1,,br=ar[b1,b1][b1,ar]b1[b2,b2][b2,ar]b2[br1,br1][br1,ar]br1,容易验证 b 1 , … , b r \mathrm{b_1,\dots,b_r} b1,,br 两两正交,且 b 1 , … , b r \mathrm{b_1,\dots,b_r} b1,,br a 1 , … , a r \mathrm{a_1,\dots,a_r} a1,,ar 等价。
    • 然后将 b 1 , … , b r \mathrm{b_1,\dots,b_r} b1,,br 单位化,得到标准正交基 e 1 , … , e r , e i = b i ∣ ∣ b i ∣ ∣ \mathrm{e_1,\dots,e_r},\mathrm{e_i=\dfrac{b_i}{||b_i||}} e1,,er,ei=∣∣bi∣∣bi
    • 施密特正交化不仅满足 b 1 , … , b r \mathrm{b_1,\dots,b_r} b1,,br a 1 , … , a r \mathrm{a_1,\dots,a_r} a1,,ar 等价,还满足 b 1 , … , b k \mathrm{b_1,\dots,b_k} b1,,bk a 1 , … , a k \mathrm{a_1,\dots,a_k} a1,,ak 等价,其中 1 ≤ k ≤ r \mathrm{1\le k\le r} 1kr
    • 施密特正交化的几何意义是将旧基迭代式地投影到正交基上。
  • 如果 n n n 阶矩阵 A \mathrm{A} A 满足 A T A = E \mathrm{A^TA=E} ATA=E,则称 A \mathrm{A} A 是正交矩阵。
    • A \mathrm{A} A 按列分块, A T \mathrm{A^T} AT 按行分块, ( a 1 T ⋮ a n T ) ( a 1 , … , a n ) = E \begin{pmatrix}\mathrm{a_1}^T\\\vdots\\\mathrm{a_n}^T\end{pmatrix}(\mathrm{a_1,\dots,a_n})=\mathrm{E} a1TanT (a1,,an)=E,即 a i T a j = { 1 , 当 i = j 0 , 当 i ≠ j \mathrm{a_i^Ta_j}=\begin{cases}1,当i=j\\0,当i\ne j\end{cases} aiTaj={1,i=j0,i=j
    • 方阵 A \mathrm{A} A 为正交矩阵的充分必要条件是 A \mathrm{A} A 的列向量 a 1 , … , a n \mathrm{a_1,\dots,a_n} a1,,an 是一组标准正交基。
    • A T A = A A T = E \mathrm{A^TA=AA^T=E} ATA=AAT=E,即行向量同理。
  • 正交矩阵的性质
    • A \mathrm{A} A 是正交矩阵,则 A − 1 = A T \mathrm{A^{-1}=A^T} A1=AT 也是正交矩阵,且 ∣ A ∣ = 1 或 − 1 |\mathrm{A}|=1或-1 A=11
    • A , B \mathrm{A,B} A,B 是正交矩阵,则 A B \mathrm{AB} AB 也是正交矩阵。
  • P \mathrm{P} P 是正交矩阵,则线性变换 y = P x \mathrm{y=Px} y=Px 称为正交变换。 ∥ y ∥ = ∥ P x ∥ = ∥ x ∥ \mathrm{\|y\|=\|Px\|=\|x\|} ∥y∥=∥Px∥=∥x∥,即正交变换不改变向量的长度。
12. 方阵的特征值与特征向量
  • A \mathrm{A} A n n n 阶方阵,若存在数 λ \lambda λ 和非零向量 x \mathrm{x} x,使得 A x = λ x \mathrm{Ax=\lambda x} Ax=λx,则称 λ \lambda λ 是方阵 A \mathrm{A} A 的特征值, x \mathrm{x} x 是对应于特征值 λ \lambda λ 的特征向量。
  • ( A − λ E ) x = 0 (\mathrm{A-\lambda E})\mathrm{x}=0 (AλE)x=0 有非零解的充分必要条件是系数行列式 ∣ A − λ E ∣ = 0 \mathrm{|A-\lambda E|=0} ∣AλE∣=0,即 ∣ a 11 − λ a 12 … a 1 n a 21 a 22 − λ … a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 … a n n − λ ∣ = 0 \begin{vmatrix}a_{11}-\lambda & a_{12} & \dots & a_{1n}\\ a_{21} & a_{22} - \lambda & \dots & a_{2n}\\ \vdots & \vdots & &\vdots\\a_{n1} & a_{n2} & \dots & a_{nn}-\lambda\end{vmatrix}=0 a11λa21an1a12a22λan2a1na2nannλ =0,该方程是以 λ \lambda λ 为未知数的一元 n n n 次方程,称为方阵 A \mathrm{A} A 的特征方程,其左端是 λ \lambda λ n n n 次多项式,记作 f ( λ ) f(\mathrm{\lambda}) f(λ),称为矩阵 A \mathrm{A} A 的特征多项式。显然特征值是特征方程的解,根据代数学基本定理,特征方程在复数范围有 n n n 个解,即 A \mathrm{A} A 在复数范围内有 n n n 个特征值。
  • 特征值的性质
    • λ 1 + ⋯ + λ n = a 11 + a 22 + ⋯ + a n n \lambda_1+\dots+\lambda_n=a_{11}+a_{22}+\dots+a_{nn} λ1++λn=a11+a22++ann
      • 特征多项式可写为 f ( λ ) = ( λ 1 − λ ) ( λ 2 − λ ) … ( λ n − λ ) f(\mathrm{\lambda})=(\lambda_1-\lambda)(\lambda_2-\lambda)\dots(\lambda_n-\lambda) f(λ)=(λ1λ)(λ2λ)(λnλ)
      • 分析特征多项式中 λ n − 1 \lambda^{n-1} λn1 项的系数,可以发现其等于由选择 n − 1 n-1 n1 项中的 − λ -\lambda λ λ i \lambda_i λi 的乘积之和 ( − 1 ) n − 1 ( λ 1 + λ 2 + ⋯ + λ n ) (-1)^{n-1}(\lambda_1+\lambda_2+\dots+\lambda_n) (1)n1(λ1+λ2++λn)
      • 特征方程左端主对角线上乘积展开后 λ n − 1 \lambda^{n-1} λn1 项的系数同理等于 ( − 1 ) n − 1 ( a 11 + a 22 + ⋯ + a n n ) (-1)^{n-1}(a_{11}+a_{22}+\dots+a_{nn}) (1)n1(a11+a22++ann),行列式组成的其他项对 λ n − 1 \lambda^{n-1} λn1 项的系数没有贡献。
    • λ 1 λ 2 … λ n = ∣ A ∣ \lambda_1\lambda_2\dots\lambda_n=|\mathrm{A}| λ1λ2λn=A
      • λ = 0 \lambda=0 λ=0
      • A \mathrm{A} A 是可逆矩阵的充分必要条件是它的 n n n 个特征值全都不为0
  • λ = λ i \lambda=\lambda_i λ=λi 是矩阵 A \mathrm{A} A 的一个特征值,则由方程 ( A − λ i E ) x = 0 \mathrm{(A-\lambda_i E)x=0} (AλiE)x=0 可求得非零解 x = p i \mathrm{x=p_i} x=pi,称 p i \mathrm{p_i} pi A \mathrm{A} A 的对应于特征值 λ i \lambda_i λi 的特征向量。显然若 p i p_i pi 是矩阵 A \mathrm{A} A 对应于特征值 λ i \lambda_i λi 的特征向量,则 k p i ( k ≠ 0 ) kp_i(k\ne 0) kpi(k=0) 也是矩阵 A \mathrm{A} A 对应于特征值 λ i \lambda_i λi 的特征向量。
  • λ \lambda λ 是方阵 A \mathrm{A} A 的特征值
    • 存在 p ≠ 0 \mathrm{p\ne 0} p=0,使 A p = λ p \mathrm{Ap=\lambda p} Ap=λp
    • λ 2 \lambda^2 λ2 A 2 \mathrm{A^2} A2 的特征值
    • A \mathrm{A} A 可逆时, 1 λ \dfrac{1}{\lambda} λ1 A − 1 \mathrm{A^{-1}} A1 的特征值
    • λ k \lambda^k λk A k \mathrm{A^k} Ak 的特征值
    • φ ( λ ) \varphi(\lambda) φ(λ) φ ( A ) \varphi(\mathrm{A}) φ(A) 的特征值
  • λ 1 , … , λ m \lambda_1,\dots,\lambda_m λ1,,λm 是方阵 A \mathrm{A} A m m m 个特征值, p 1 , … , p m \mathrm{p_1,\dots,p_m} p1,,pm 依次是与之对应的特征向量,如果 λ 1 , … , λ m \lambda_1,\dots,\lambda_m λ1,,λm 各不相同,则 p 1 , … , p m \mathrm{p_1,\dots,p_m} p1,,pm 线性无关。
  • λ 1 \lambda_1 λ1 λ 2 \lambda_2 λ2 是方阵 A \mathrm{A} A 的两个不同的特征值, ξ 1 , … , ξ s \mathrm{\xi_1,\dots,\xi_s} ξ1,,ξs η 1 , … , η t \mathrm{\eta_1,\dots,\eta_t} η1,,ηt 分别是与之对应的线性无关的特征向量,则 ξ 1 , … , ξ s , η 1 , … , η t \mathrm{\xi_1,\dots,\xi_s,\eta_1,\dots,\eta_t} ξ1,,ξs,η1,,ηt 线性无关。
13. 相似矩阵
  • A , B \mathrm{A,B} A,B 是两个 n n n 阶矩阵,若存在可逆矩阵 P \mathrm{P} P,使得 B = P − 1 A P \mathrm{B=P^{-1}AP} B=P1AP,则称矩阵 A \mathrm{A} A B \mathrm{B} B 相似,对 A \mathrm{A} A 进行运算 P − 1 A P \mathrm{P^{-1}AP} P1AP 称为对 A \mathrm{A} A 进行相似变换,可逆矩阵 P \mathrm{P} P 称为把 A \mathrm{A} A 变成 B \mathrm{B} B 的相似变换矩阵。
  • n n n 阶矩阵 A \mathrm{A} A B \mathrm{B} B 相似,则 A \mathrm{A} A B \mathrm{B} B 的特征多项式相同,从而 A \mathrm{A} A B \mathrm{B} B 的特征值也相同。
  • n n n 阶矩阵 A \mathrm{A} A 与对角矩阵 Λ = d i a g ( λ 1 , … , λ n ) \Lambda=\mathrm{diag}(\lambda_1,\dots,\lambda_n) Λ=diag(λ1,,λn) 相似,则 λ 1 , … , λ n \lambda_1,\dots,\lambda_n λ1,,λn A \mathrm{A} A n n n 个特征值。
  • 利用相似变换,可以把一个矩阵化为对角矩阵,由此可以方便地计算矩阵多项式,为此寻求相似变换矩阵 P \mathrm{P} P,使得矩阵 P − 1 A P = Λ \mathrm{P^{-1}AP=\Lambda} P1AP=Λ 为对角矩阵,这称为把矩阵 A \mathrm{A} A 对角化。
  • 将相似变换矩阵 P \mathrm{P} P 按列分块,由 P − 1 A P = Λ \mathrm{P^{-1}AP=\Lambda} P1AP=Λ,得 A P = P Λ \mathrm{AP=P\Lambda} AP=,即 A ( p 1 , … , p n ) = ( p 1 , … , p n ) d i a g ( λ 1 , … , λ n ) \mathrm{A(p_1,\dots,p_n)=(p_1,\dots,p_n)\mathrm{diag}(\lambda_1,\dots,\lambda_n)} A(p1,,pn)=(p1,,pn)diag(λ1,,λn),从而 A p i = λ i p i \mathrm{Ap_i=\lambda_ip_i} Api=λipi,即 p i \mathrm{p_i} pi A \mathrm{A} A 的对应于特征值 λ i \lambda_i λi 的特征向量。
  • n n n 阶矩阵 A \mathrm{A} A 与对角矩阵相似(即 A \mathrm{A} A 能对角化)的充分必要条件是 A \mathrm{A} A n n n 个线性无关的特征向量。
    • A \mathrm{A} A n n n 个线性无关的特征向量,则相似变换矩阵是可逆矩阵
    • 如果 n n n 阶矩阵 A \mathrm{A} A n n n 个特征值互不相等,则 A \mathrm{A} A 能对角化。
14. 对称矩阵的对角化
  • 一个 n n n 阶矩阵具备什么条件才能对角化?这是一个复杂的问题,但对称矩阵可以很方便地证明其能对角化。
  • 对称矩阵的特征值和特征向量的性质
    • 对称矩阵的特征值都是实数。特征向量可以取实向量。
    • λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2 是对称矩阵 A \mathrm{A} A 的两个特征值, p 1 , p 2 \mathrm{p_1,p_2} p1,p2 是对应的特征向量,若 λ 1 ≠ λ 2 \lambda_1\ne \lambda_2 λ1=λ2 p 1 , p 2 \mathrm{p_1,p_2} p1,p2 正交。
  • A \mathrm{A} A n n n 阶对称矩阵,则必有正交矩阵 P \mathrm{P} P,使 P − 1 A P = P T A P = Λ \mathrm{P^{-1}AP=P^TAP=\Lambda} P1AP=PTAP=Λ,其中 Λ \Lambda Λ 是以 A \mathrm{A} A n n n 个特征值为对角元的对角矩阵。
  • A \mathrm{A} A n n n 阶对称矩阵, λ \lambda λ A \mathrm{A} A 特征方程的 k k k 重根,则矩阵 A − λ E \mathrm{A-\lambda E} AλE 的秩为 n − k n-k nk,从而对应特征值 λ \lambda λ 恰有 k k k 个线性无关的特征向量。
    • 对称矩阵 A \mathrm{A} A 与对角矩阵 Λ = d i a g ( λ 1 , … , λ n ) \Lambda=\mathrm{diag}(\lambda_1,\dots,\lambda_n) Λ=diag(λ1,,λn) 相似,即 A = P Λ P − 1 \mathrm{A=P\Lambda P^{-1}} A=P1,则 A − λ E \mathrm{A-\lambda E} AλE Λ − λ E \Lambda - \lambda E ΛλE 相似,即 A − λ E = P ( Λ − λ E ) P − 1 \mathrm{A-\lambda E=P(\Lambda-\lambda E)P^{-1}} AλE=P(ΛλE)P1,从而 A − λ E \mathrm{A-\lambda E} AλE 的秩等于 Λ − λ E \Lambda - \lambda E ΛλE 的秩,即 n − k n-k nk
  • 对称矩阵对角化的步骤:
    • 求出 A \mathrm{A} A 的特征值 λ 1 , … , λ s \lambda_1,\dots,\lambda_s λ1,,λs 与其对应重数 k 1 , … , k s ( k 1 + ⋯ + k s = n ) k_1,\dots,k_s(k_1+\dots+k_s=n) k1,,ks(k1++ks=n)
    • 对每个 k i k_i ki 重特征值 λ i \lambda_i λi,求方程 ( A − λ i E ) x = 0 (\mathrm{A-\lambda_i E})x=0 (AλiE)x=0 的基础解系,得 k i k_i ki 个线性无关的向量,再把它们正交化、单位化。
    • 然后将这些两两正交的单位特征向量按对角元顺序排成正交矩阵 P \mathrm{P} P,则 P − 1 A P = P T A P = Λ \mathrm{P^{-1}AP=P^TAP=\Lambda} P1AP=PTAP=Λ
15. 二次型及其标准形
  • 含有 n n n 个变量的二次齐次函数 f ( x 1 , … , x n ) = a 11 x 1 2 + ⋯ + a n n x n 2 + 2 a 12 x 1 x 2 + 2 a 13 x 1 x 3 + ⋯ + 2 a n − 1 , n x n − 1 x n = ∑ i , j = 1 n a i j x i x j f(x_1,\dots,x_n)=a_{11}x_1^2+\dots+a_{nn}x_n^2+2a_{12}x_1x_2+2a_{13}x_1x_3+\dots+2a_{n-1,n}x_{n-1}x_n=\sum\limits_{i,j=1}^na_{ij}x_ix_j f(x1,,xn)=a11x12++annxn2+2a12x1x2+2a13x1x3++2an1,nxn1xn=i,j=1naijxixj 称为二次型。
  • 通过可逆的线性变换 x = C y \mathrm{x=Cy} x=Cy,二次型 f ( x ) f(\mathrm{x}) f(x) 可以变为只含平方项的标准形 ∑ i = 1 n λ i y i 2 \mathrm{\sum\limits_{i=1}^n\lambda_iy_i^2} i=1nλiyi2。如果标准形的系数只从 1 , − 1 , 0 1,-1,0 1,1,0 中取值,则称该二次型为规范形。当 a i j a_{ij} aij 为复数时,二次型 f ( x ) f(\mathrm{x}) f(x) 称为复二次型;当 a i j a_{ij} aij 为实数时,二次型 f ( x ) f(\mathrm{x}) f(x) 称为实二次型。
  • 二次型 f ( x ) = x T A x f(\mathrm{x})=\mathrm{x^TAx} f(x)=xTAx,其中对称矩阵 A \mathrm{A} A 称为二次型 f f f 的矩阵,对称矩阵 A \mathrm{A} A 的秩称为二次型 f f f 的秩。
  • A \mathrm{A} A B \mathrm{B} B n n n 阶矩阵,若有可逆矩阵 C \mathrm{C} C,使得 B = C T A P \mathrm{B=C^TAP} B=CTAP,则称 A \mathrm{A} A B \mathrm{B} B 合同。
    • A \mathrm{A} A 为对称矩阵,则 B \mathrm{B} B 也为对称矩阵,且 R ( A ) = R ( B ) R(\mathrm{A})=R(\mathrm{B}) R(A)=R(B)
    • 经可逆变换 x = C y \mathrm{x=Cy} x=Cy 后,二次型 f f f 的矩阵 A \mathrm{A} A 变为与 A \mathrm{A} A 合同的矩阵 C T A C \mathrm{C^TAC} CTAC,且二次型的秩不变。
    • 要使二次型 f f f 变为标准形,就是要使 C T A C \mathrm{C^TAC} CTAC 成为对角矩阵,即对称矩阵 A \mathrm{A} A 合同对角化。
  • 任给二次型 f f f,总有正交变换 x = P y \mathrm{x=Py} x=Py,使 f f f 化为标准形 ∑ i = 1 n λ i y i 2 \mathrm{\sum\limits_{i=1}^n\lambda_iy_i^2} i=1nλiyi2,其中 λ 1 , … , λ n \lambda_1,\dots,\lambda_n λ1,,λn 是二次型 f f f 的矩阵 A \mathrm{A} A 的特征值。
  • 任给二次型 f f f,总有可逆变换 x = C z \mathrm{x=Cz} x=Cz,使 f ( C z ) f(\mathrm{Cz}) f(Cz) 为规范形。
  • 使用正交变换化二次型为标准形,具有保持几何形状不变的优点,如果不限于正交变换,那么还可以使用拉格朗日配方法。如果 f f f 中含有平方项,可以尽可能进行配方,然后通过平方差换元消去交叉项,最后得到全为平方的式子,最后换元可以得到标准形或规范形。
  • 设二次型 f = x T A x f=\mathrm{x^TAx} f=xTAx 的秩为 r r r,且有两个可逆变换 x = C y \mathrm{x=Cy} x=Cy y = P z \mathrm{y=Pz} y=Pz,使 f = ∑ i = 1 r k i y i 2 ( k i ≠ 0 ) f=\sum\limits_{i=1}^r k_iy_i^2(k_i\ne0) f=i=1rkiyi2(ki=0) f = ∑ i = 1 r λ i y i 2 ( λ i ≠ 0 ) f=\sum\limits_{i=1}^r\lambda_iy_i^2(\lambda_i\ne0) f=i=1rλiyi2(λi=0),则 k 1 , … , k r k_1,\dots,k_r k1,,kr λ 1 , … , λ r \lambda_1,\dots,\lambda_r λ1,,λr 中正数的个数相等,这个定理称为惯性定理。二次型的标准形中正系数的个数称为正惯性指数,负系数的个数称为负惯性指数。
  • 设二次型 f ( x ) = x T A x f(\mathrm{x})=\mathrm{x^TAx} f(x)=xTAx,如果对任何 x ≠ 0 \mathrm{x\ne0} x=0,都有 f ( x ) > 0 f\mathrm{(x)>0} f(x)>0,则称 f f f 为正定二次型,并称对称矩阵 A \mathrm{A} A 是正定的;如果对任何 x ≠ 0 \mathrm{x\ne0} x=0,都有 f ( x ) < 0 f\mathrm{(x)<0} f(x)<0,则称 f f f 为负定二次型,并称对称矩阵 A \mathrm{A} A 是负定的。
  • n n n 元二次型 f ( x ) = x T A x f(\mathrm{x})=\mathrm{x^TAx} f(x)=xTAx 是正定的充分必要条件是它的标准形的 n n n 个系数全为正,即它的规范形的 n n n 个系数全为1,亦即它的正惯性指数为 n n n
  • 对称矩阵 A \mathrm{A} A 是正定的充分必要条件是 A \mathrm{A} A 的所有特征值都是正的。
  • 对称矩阵 A \mathrm{A} A 是正定的充分必要条件是 A \mathrm{A} A 的各阶主子式都是正的,即 a 11 > 0 , ∣ a 11 a 12 a 21 a 22 ∣ > 0 , … , ∣ a 11 … a 1 n ⋮ ⋮ a n 1 … a n n ∣ > 0 a_{11}>0,\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}>0,\dots,\begin{vmatrix}a_{11}&\dots&a_{1n}\\\vdots&&\vdots\\a_{n1}&\dots&a_{nn}\end{vmatrix}>0 a11>0, a11a21a12a22 >0,, a11an1a1nann >0。对称矩阵 A \mathrm{A} A 是负定的充分必要条件是 A \mathrm{A} A 的奇数阶主子式都是负的,偶数阶主子式都是正的。这个定理称为赫尔维茨定理。

下一节:无
总目录【线性代数】目录


网站公告

今日签到

点亮在社区的每一天
去签到