跳到主要内容

对角化

特征子空间

矩阵 AA 的属于 λ0\lambda_0 的全部特征向量,再添上零向量,构成一个线性空间,称为矩阵 AA 的一个特征子空间,记为 E(λ0)E(\lambda_0)。它是齐次线性方程组:

(λ0IA)X=0(\lambda_0 I-A)X=0

的解空间。

对于特征子空间 E(λi)=N(λiIA)E(\lambda_i)=N(\lambda_i I-A),由亏加秩定理有:

r(λiIA)+dimN(λiIA)=nr(\lambda_i I-A)+\operatorname{dim} N(\lambda_i I-A)=n

因此,特征子空间 E(λi)E(\lambda_i) 的维数为:

dimE(λi)=nr(λiIA)\operatorname{dim} E(\lambda_i)=n-r(\lambda_i I-A)

也称为 λi\lambda_i几何重数

不变子空间

在研究线性变换 TT 的时候,常常希望选取空间 VV 的一个基,使得线性变换 TT 对于这个基的矩阵具有尽可能简单的形状。

VV 是数域 FF 上的线性空间,WWVV 的一个子空间,TTVV 上的一个线性变换。如果对于 WW 中任意的向量 xx,都有 T(x)T(x) 也在 WW 中(也称为空间在变换下不变或稳定),称 WWTT 的一个不变子空间。

空间在变换下不变,并不是说坐标在变换下真的「不变」,有可能是进行了一个拉伸等变形,只是变形后还落在空间里。

  • 线性空间 VV 的任意一个子空间都是数乘变换的不变子空间。
  • 对于 VV 中任意的线性变换 TT,空间 VV 和零子空间都是 TT 的不变子空间,称为平凡不变子空间。
  • 不变子空间的交与和也是不变子空间。

WW 是线性变换 TT 的一个不变子空间。只考虑 TT 在不变子空间 WW 上的作用,就得到子空间 WW 本身的线性变换,称为 TT 在子空间 WW 上的限制,记作 TW{T|}_W

对于 VV 中任意的线性变换 TT,像空间 R(T)R(T) 与核空间 N(T)N(T)TT 的不变子空间。这两种情况的含义是,空间 VV 在变换前后,完成了自身的压缩(像空间),或者压缩到 00(核空间)。

对于 VV 中任意的线性变换 TTTT 的特征子空间是 TT 的不变子空间。

准素分解

根据代数基本定理,最小多项式可以分解为:

mA(λ)=(λλ1)r1(λλS)rSm_A(\lambda)={(\lambda-\lambda_1)}^{r_1}\cdots{(\lambda-\lambda_S)}^{r_S}

考虑最小多项式代入变元 λ\lambda 为矩阵 AA 后,各个因式的核空间,构成矩阵 AA 的一系列不变子空间:

Wi=N((λiIA)ri)W_i=N({(\lambda_i I-A)}^{r_i})

定理:该不变子空间 WiW_i 的维数,恰好为特征值 λi\lambda_i 的代数重数。

回顾一下,代数重数是指特征多项式各个因式的次数,几何重数是指特征子空间 E(λi)=N(λiIA)E(\lambda_i)=N(\lambda_i I-A) 的维数。这个不变子空间 WiW_i 与特征子空间 E(λi)E(\lambda_i),两者都是矩阵的核空间,并且两个矩阵构成最小多项式 rir_i 次幂的关系。也就是说,特征子空间的维数是几何重数,「特征子空间」经过最小多项式 rir_i 次幂后到达一个「不变子空间」,不变子空间的维数到达了特征多项式的代数重数。

该定理其实是下面准素分解定理的推论。

记矩阵 AA 对应的线性变换 TT,在每个子空间 WiW_i 上的限制 Ti=TWiT_i={T|}_{W_i}。于是 TiT_i 的最小多项式是 (xλi)ri(x-\lambda_i)^{r_i}

定理:设 VV 是域 FF 上的线性空间,TTVV 上的一个线性变换。那么空间 VV 可以关于线性变换 TT 进行准素分解,拆成若干不变子空间 WiW_i 的直和。

V=W1W2WSV=W_1\oplus W_2\oplus\cdots\oplus W_S

这意味着,TT 在某组基下的矩阵是准对角阵:

diag{A1,A2,,AS}\operatorname{diag}\{A_1,A_2,\cdots,A_S\}

其中,AiA_iTiT_i 在对应基下的矩阵。

该定理表明,可以使用不变子空间简化线性变换的矩阵。

可对角化矩阵

对于 nn 阶方阵 AA,如果相似于一个对角阵,则称 AA 为可对角化矩阵,或称单纯矩阵。

  • 对角阵的和、积、逆,如果存在,仍然是对角阵,其对角线上的元素就是它的特征值。
  • 线性变换 TT 的矩阵为可对角化矩阵,等价于 TT 在某组基下的矩阵为对角阵。

定理:设矩阵 AA 的全部互异特征根为 λ1,,λm\lambda_1,\cdots,\lambda_m,则以下命题等价:

  • 矩阵 AA 可对角化。
  • 矩阵 AAnn 个线性无关的特征向量。
  • 以下公式成立:
dimE(λ1)++dimE(λm)=n\operatorname{dim} E(\lambda_1)+\cdots+\operatorname{dim} E(\lambda_m)=n

前文已经指出,特征多项式的分解式中特征值的次数称为代数重数,特征子空间的维数称为几何重数。这个定理也表明,矩阵 AA 可对角化,等价于 AA 的每个特征值 λ\lambda 的代数重数都等于它的几何重数。

推论:如果 nn 阶方阵 AA 恰有 nn 个互异特征值,则它必可对角化。反之则不一定。

定理:矩阵 AA 可对角化当且仅当 AA 的最小多项式没有重根。

矩阵的相似也会保持特征向量之间的线性相关关系不变。

特征向量完全可能不是实数,也完全可能找不到 nn 个线性无关的特征向量。

对于重特征值而言,特征向量张成空间。为了描述这个空间,需要从其中选择代表。一般会选择线性无关的代表,代表的个数就是空间的维数。

选取代表时,常常将它们正交化与单位化。最终得到的就是一套单位正交的代表。

特征向量不一定正交,不同特征值的特征向量,可能无法正交。因此正交化只能对于重特征值的特征向量进行。但是单位化可以对任意特征向量进行。

幂零矩阵

TT 是空间 VV 的一个线性变换。如果存在一个正整数 rr,使得 TrT^r 为零变换,称 TT 是空间 VV 的一个幂零变换。

对于某一个正整数 rr,满足条件 Nr=0N^r=0 的矩阵称为幂零矩阵。

一般可以进一步假定 rr 是使 TrT^r 为零变换的最小正整数,于是 TT 的最小多项式是 xrx^r。于是存在一个向量 ξ0\xi_0,使得:

  • Tr(ξ0)=0T^r(\xi_0)=0
  • Tr1(ξ0)0T^{r-1}(\xi_0)\neq 0

循环子空间

定理:设 TT 是空间 VV 的一个线性变换,ξ\xi 是空间 VV 的一个向量。如果存在一个正整数 ss,使得:

  • Ts(ξ)=0T^s(\xi)=0
  • Ts1(ξ)0T^{s-1}(\xi)\neq 0

那么向量 ξ,T(ξ),,Ts1(ξ)\xi,T(\xi),\cdots,T^{s-1}(\xi) 线性无关。

由这个定理可以给出一个定义:

TT 是空间 VV 的一个线性变换,WWVV 的一个子空间。如果存在一个向量 ξ0\xi_0 和一个正整数 rr,使得:

  • 向量 ξ0,T(ξ0),,Tr1(ξ0)\xi_0,T(\xi_0),\cdots,T^{r-1}(\xi_0) 构成 WW 的一个基。

  • 如下等式成立:

    Tr(ξ0)=0T^r(\xi_0)=0

那么子空间 WW 称为关于 TT 的一个循环子空间,简称 TT 循环子空间。此时 ξ0\xi_0 称为循环子空间 WW 的一个生成向量,向量 ξ0,T(ξ0),,Tr1(ξ0)\xi_0,T(\xi_0),\cdots,T^{r-1}(\xi_0) 称为 WW 的一个循环基。

显然,一个 TT 循环子空间 WWTT 作用下不变,并且对于循环子空间 WW 中的任意向量 ξ\xi,均有 Tr(ξ)=0T^r(\xi)=0,这里 rr 为循环子空间的维数。

幂零 Jordan 块

如果空间 WW 是变换 TT 的循环子空间,那么 TTWW 上的限制 TW{T|}_WWW 的一个幂零变换,并且 TW{T|}_W 关于 WW 的倒序排列的循环基 Tr1(ξ0),Tr2(ξ0),,ξ0T^{r-1}(\xi_0),T^{r-2}(\xi_0),\cdots,\xi_0 的矩阵是如下形状的 rr 阶上三角矩阵:

Nr=(0100000100000000000100000)N_r=\begin{pmatrix} 0 & 1 & 0 & \cdots & 0 & 0\\ 0 & 0 & 1 & \cdots & 0 & 0\\ 0 & 0 & 0 & \cdots & 0 & 0\\ \vdots & \vdots & \vdots & & \vdots& \vdots\\ 0 & 0 & 0 & \cdots & 0 & 1\\ 0 & 0 & 0 & \cdots & 0 & 0\\ \end{pmatrix}

矩阵 NrN_r 称为一个 rr 阶幂零 Jordan 矩阵,或者 rr 阶幂零 Jordan 块。

TTnn 维空间 VV 的一个幂零变换,把出现在 VV 关于 TT 的循环子空间的分解中,唯一确定的一组正整数 r1rSr_1\geq\cdots\geq r_S 叫做 TT 的不变指数。

对于 nn 阶幂零矩阵 AAAA 与一个上述形状的矩阵 NN 相似,也唯一确定一个正整数序列 r1rSr_1\geq\cdots\geq r_S,称为矩阵 AA 的不变指数。

幂零阵虽然不能和对角阵相似,但是可以相似于这样的标准形式。在 Jordan 标准型,将相似对角化与幂零阵的标准形式,二者结合起来,给出一般的矩阵通过相似变换可以达到的标准形式。

一些定理

  1. TT 是空间 VV 的一个幂零变换,而

    h(x)=a0+a1x++amxmh(x)=a_0+a_1x+\cdots+a_mx^m

    是一个多项式,那么当且仅当 a00a_0\neq 0 时,线性变换 h(T)h(T) 有逆变换。当 h(T)h(T) 可逆时,h(T)h(T) 的逆变换也是 TT 的一个多项式。

  2. TT 是空间 VV 的一个幂零变换,WW 是一个 rrTT 循环子空间,ξ\xiWW 中的向量。如果存在一个整数 kk,使得

    Trk(ξ)=0T^{r-k}(\xi)=0

    那么存在 WW 中的向量 η\eta,使得

    ξ=Tk(η)\xi=T^k(\eta)
  3. TTnn 维空间 VV 的一个幂零变换,xrx^rTT 的最小多项式,令 W1W_1 是一个 rrTT 循环子空间,那么存在 W1W_1 的一个余子空间 W2W_2,使得:

    V=W1W2V=W_1\oplus W_2

    并且 W2W_2 也在 TT 作用下不变。

  4. TTnn 维空间 VV 的一个幂零变换,那么 VV 可以分解为 TT 循环子空间的直和:

    V=W1W2WSV=W_1\oplus W_2\oplus\cdots\oplus W_S
  5. 每一个 nn 阶幂零矩阵都与一个形如:

    N=(Nr10Nr20NrS)N=\begin{pmatrix} N_{r_1} & & & 0\\ & N_{r_2} & & \\ & & \cdots & \\ 0 & & & N_{r_S}\\ \end{pmatrix}

    的矩阵相似,这里的每一个 NriN_{r_i} 是一个 rir_i 阶幂零 Jordan 块。

  6. 如果规定 TT 循环子空间 WiW_i 按照维数 rir_i 降序排列 r1rSr_1\geq\cdots\geq r_S,那么将 VV 分解为 TT 循环子空间的方法是由 TT 唯一确定的。