跳到主要内容

Jordan 标准型

Jordan 分解

TTnn 维空间 VV 上的一个线性变换。如果 TT 的最小多项式为:

mA(λ)=(λλ1)r1(λλ2)r2(λλk)rkm_A(\lambda)={(\lambda-\lambda_1)}^{r_1}{(\lambda-\lambda_2)}^{r_2}\cdots{(\lambda-\lambda_k)}^{r_k}

那么由准素分解可知,空间 VV 可以分解为子空间的直和:

V=V1V2VkV=V_1\oplus V_2\oplus\cdots\oplus V_k

其中 Vi=N((AλiI)ri)V_i=N\left({(A-\lambda_i I)}^{r_i}\right),式中 AATT 对应的矩阵,这些子空间都在 TT 作用下不变。

令变换 TiT_iVV 在子空间 ViV_i 上的射影,即构造多项式 ui(T)u_i(T) 使得:

  • Ti=ui(T)mA(T)(TλiTe)riT_i=u_i(T)\frac{m_A(T)}{{(T-\lambda_i T_e)}^{r_i}}
  • T1+T2++Tk=TeT_1+T_2+\cdots+T_k=T_e

式中 TeT_e 表示空间 VV 的恒等变换。于是有性质:

  • 变换 TiT_i 在空间 ViV_i 上的限制 TiVi{T_i|}_{V_i} 为空间 ViV_i 的恒等变换。
  • 如果 iijj 不相等,变换 TiT_i 在空间 VjV_j 上的限制 TiVj{T_i|}_{V_j} 为空间 VjV_j 的零变换。

于是变换 TiT_i 将空间 VV 的每一个向量 ξ\xi 映射为它在空间 ViV_i 中的分量 ξi\xi_i

构造变换:

TD=λ1T1+λ2T2++λkTkT_D=\lambda_1 T_1+\lambda_2 T_2+\cdots+\lambda_k T_k

由于每一个变换 TiT_i 都是变换 TT 的一个多项式,所以变换 TDT_D 也是变换 TT 的一个多项式,于是每一个子空间 ViV_i 在变换 TDT_D 下不变。

由上述等式可知,变换 TDT_D 在子空间 ViV_i 上的限制 TDVi{T_D|}_{V_i} 是子空间 ViV_i 的一个位似,位似系数为 λi\lambda_i。因此,变换 TDT_D 可以对角化。

构造:

TN=TTDT_N=T-T_D

于是变换 TNT_N 也是变换 TT 的一个多项式,所以每一个子空间 ViV_i 在变换 TNT_N 下不变。对于子空间 ViV_i 中的任意向量 ξi\xi_i,有:

TNri(ξi)=TTDri(ξi)=TλiTiri(ξi)=0{T_N}^{r_i}(\xi_i)={T-T_D}^{r_i}(\xi_i)={T-\lambda_i T_i}^{r_i}(\xi_i)=0

rr 为全体 rir_i 的最大值,那么对于空间 VV 中的任意向量 ξ\xi,变换 TNT_Nrr 次方将向量 ξ\xi 映射至零向量。因此变换 TNT_N 是一个幂零变换。

这样,空间 VV 的每一个变换 TT 都可以写成:

T=TD+TNT=T_D+T_N

其中 TDT_D 可以对角化,而 TNT_N 是一个幂零变换。因为 TDT_DTNT_N 都是变换 TT 的多项式,所以它们的乘积可交换:

TDTN=TNTDT_DT_N=T_NT_D

定理:设 T1T_1T2T_2 是空间 VV 的两个可对角化变换,且 T1T2=T2T1T_1T_2=T_2T_1,那么存在一个基,使得 T1T_1T2T_2 关于这同一个基的矩阵是对角形式。

定理:设 TTnn 维空间 VV 上的一个线性变换,那么存在一个可对角化变换 TDT_D 和一个幂零变换 TNT_N,使得:

  • T=TD+TNT=T_D+T_N
  • TDTN=TNTDT_DT_N=T_NT_D

它们都是变换 TT 的多项式,并且它们由变换 TT 唯一确定。

该定理给出关于变换 TT 的分解,称为 TT 的若尔当(Jordan)分解,TDT_D 叫做 TT 的可对角化部分,TNT_N 叫做 TT 的幂零部分。

同样地,有矩阵的 Jordan 分解:

定理:设 AA 是一个 nn 阶矩阵,那么存在一个可对角化矩阵 DD 和一个幂零矩阵 NN,使得:

  • A=D+NA=D+N
  • DN=NDDN=ND

它们都是矩阵 AA 的多项式,并且它们由矩阵 AA 唯一确定。

该定理给出关于矩阵 AA 的分解,称为 AA 的若尔当(Jordan)分解,DD 叫做 AA 的可对角化部分,NN 叫做 AA 的幂零部分。

lambda 矩阵

接下来引入的部分是含有变元参量 λ\lambda 的更广义的矩阵,不仅仅是一个数表。这部分讨论相较单纯由数构成的矩阵而言,更加广泛一些。

对于 λ\lambda 矩阵,对应空间相应的域,变为含有一个变元 λ\lambda 的有理式域。

λ\lambda 的多项式为元素的矩阵称为 λ\lambda 矩阵,记为 A(λ)A(\lambda)

由于多项式域包含数域,数字矩阵是特殊的 λ\lambda 矩阵,数字矩阵 AA 的特征矩阵 λIA\lambda I-A 是一种 λ\lambda 矩阵。

lambda 矩阵的初等变换

对于 λ\lambda 矩阵,同样可以定义加减法、乘法、初等变换、秩。对于 λ\lambda 方阵,同样可以定义行列式、余子式、代数余子式。

对于 λ\lambda 矩阵,初等变换与数阵大多相同,仅将倍加变换改为(这里以行变换为例):

  • λ\lambda 的多项式 φ(λ)\varphi(\lambda) 乘某行并加到另一行上。

注意倍乘变换不进行修改。这是因为倍加变换不改变行列式,而倍乘变换改变行列式。为了保持多项式域的秩的性质,行列式只能在数域上进行改变。

相应的初等矩阵也一并进行修改。

易见三种初等阵的行列式均为非零常数,因此均为满秩。所以它们左乘或右乘,不改变 λ\lambda 矩阵的秩。

A(λ)A(\lambda) 经过有限次初等变换变为 B(λ)B(\lambda),则称 A(λ)A(\lambda)B(λ)B(\lambda) 等价。

对于 λ\lambda 矩阵,如果等价,则秩相同。反之则不然,这与数字矩阵有区别。

Smith 标准型

定理:设 λ\lambda 矩阵的秩是 rr,则 A(λ)A(\lambda) 一定等价于:

(D(λ)000)\begin{pmatrix} D(\lambda) & 0\\ 0 & 0\\ \end{pmatrix}

其中:

D(λ)=(d1(λ)dr(λ))D(\lambda)=\begin{pmatrix} d_1(\lambda) & & \\ & \ddots & \\ & & d_r(\lambda)\\ \end{pmatrix}

每一个 di(λ)d_i(\lambda) 是一个首 11 多项式,并且相邻两个多项式有整除关系 di(λ)di+1(λ)d_i(\lambda)|d_{i+1}(\lambda)

称此标准型为 Smith 标准型,称 di(λ)d_i(\lambda) 为不变因子。

具体求解 Smith 标准型的办法是,从左上角到右下角进行消元,每次左上角的元素是右下方剩余的全体多项式的最大公因式,并借助左上角的元素将该行该列全部消为 00

定理:条件 A(λ)A(\lambda)B(λ)B(\lambda) 等价,等价于条件 A(λ)A(\lambda)B(λ)B(\lambda) 拥有完全一样的不变因子。

初等因子

由代数基本定理,设 A(λ)A(\lambda) 的不变因子 d1(λ),d2(λ),,dm(λ)d_1(\lambda),d_2(\lambda),\cdots,d_m(\lambda) 的分解为:

di(λ)=(λλ1)ei1(λλ2)ei2(λλS)eiSd_i(\lambda)={(\lambda-\lambda_1)}^{e_{i1}}{(\lambda-\lambda_2)}^{e_{i2}}\cdots{(\lambda-\lambda_S)}^{e_{iS}}

其中 λ1,,λS\lambda_1,\cdots,\lambda_S 互不相同。由于:

di(λ)di+1(λ)d_i(\lambda)|d_{i+1}(\lambda)

因此指数 e1j,e2j,,emje_{1j},e_{2j},\cdots,e_{mj} 递增,并且最后一项 dm(λ)d_m(\lambda) 的各项指数均非零。

上式中指数大于零的全部因子,统称为 A(λ)A(\lambda) 的初等因子。

注意,初等因子计重数。如果对于某个 jj,指数 eije_{ij} 出现了若干次,则对应的初等因子 (λλj)eij{(\lambda-\lambda_j)}^{e_{ij}} 也应当出现相应次数。

之前的定理说明,A(λ)A(\lambda)B(λ)B(\lambda) 等价,等价于他们两个拥有完全一致的不变因子。不变因子完全相同,自然初等因子也完全相同,但是反之则不然。事实上有结论:

定理:A(λ)A(\lambda)B(λ)B(\lambda) 不变因子完全相同,等价于初等因子和秩均完全相同。

于是「初等因子和秩均完全相同」也成为判断 λ\lambda 矩阵等价性的条件。

在初等变换的时候,也可以先将 A(λ)A(\lambda) 变换为对角阵,再求出初等因子和秩,再求出不变因子得到标准型。有结论:

定理:设 A(λ)A(\lambda) 等价于对角阵:

diag{f1(λ),f2(λ),,fr(λ),0,,0}\operatorname{diag}\{f_1(\lambda),f_2(\lambda),\cdots,f_r(\lambda),0,\cdots,0\}

那么有 f1(λ),f2(λ),,fr(λ)f_1(\lambda),f_2(\lambda),\cdots,f_r(\lambda) 的全体一次因子的幂 (λλj)eij{(\lambda-\lambda_j)}^{e_{ij}},构成 A(λ)A(\lambda) 的初等因子。

由初等因子和秩构造不变因子的具体方法为:先将初等因子按照因式分类,排成表格,把同类因式进行降幂排列放到同一行,各类因式的最高次幂放到一列,把列数用 11 补齐至秩 rr,那么每一列的乘积构成一个不变因子。

在特征矩阵中的应用

如果 AABB 是数阵,那么它们的特征矩阵是 λ\lambda 矩阵。有结论:

定理:条件数阵 AABB 相似,等价于条件特征矩阵 λIA\lambda I-AλIB\lambda I-B 等价。

由于特征矩阵 λIA\lambda I-A 只在主对角线含有 nnλ\lambda,所以秩为 nn。由上述推理,同型的数阵的特征矩阵的秩始终相等,于是有等价性:

数阵 AABB 相似,等价于特征矩阵 λIA\lambda I-AλIB\lambda I-B 有完全相同的初等因子。

对于特征矩阵 λIA\lambda I-A,初等变换保持等价性,所以不改变秩。

观察三种初等变换,由于唯一被改写的倍加变换不改变行列式,事实上三种初等变换仅对行列式的结果多项式改变常数倍,因此不改变行列式的结果多项式的因式分解与次数。

因此特征矩阵 λIA\lambda I-A 的行列式为 nn 次多项式,初等变换化为 Smith 标准型后,由于秩为 nn,行列式就是主对角线全体不变因子的乘积,也等于全体初等因子的乘积。因此,特征矩阵 λIA\lambda I-A 的全体初等因子的次数之和等于 nn

Jordan 标准型

矩阵

(λ10000λ10000λ00000λ10000λ)\begin{pmatrix} \lambda & 1 & 0 & \cdots & 0 & 0\\ 0 & \lambda & 1 & \cdots & 0 & 0\\ 0 & 0 & \lambda & \cdots & 0 & 0\\ \vdots & \vdots & \vdots & & \vdots & \vdots\\ 0 & 0 & 0 & \cdots & \lambda & 1\\ 0 & 0 & 0 & \cdots & 0 & \lambda\\ \end{pmatrix}

主对角线上的元素都是 λ\lambda,紧邻主对角线上方的元素都是 11,其余位置都是 00,叫做属于 λ\lambda 的一个 Jordan 矩阵,或称 Jordan 块。

显然,幂零 Jordan 矩阵是 Jordan 矩阵的特例,即 λ\lambda00 的情形。

定理:设 TTnn 维空间 VV 的一个变换,λ1,,λk\lambda_1,\cdots,\lambda_kTT 的一切互不相同的特征值,那么存在一个基,使得 TT 关于这个基的矩阵有形状:

(B10B20Bk)\begin{pmatrix} B_1 & & & 0\\ & B_2 & & \\ & & \ddots & \\ 0 & & & B_k\\ \end{pmatrix}

其中

Bi=(Ji10Ji20Jisi)B_i=\begin{pmatrix} J_{i1} & & & 0\\ & J_{i2} & & \\ & & \ddots & \\ 0 & & & J_{is_i}\\ \end{pmatrix}

其中 Ji1,,JisiJ_{i1},\cdots,J_{is_i} 都是属于 λi\lambda_i 的 Jordan 块。

这是因为,首先根据最小多项式:

mA(λ)=(λλ1)r1(λλ2)r2(λλk)rkm_A(\lambda)={(\lambda-\lambda_1)}^{r_1}{(\lambda-\lambda_2)}^{r_2}\cdots{(\lambda-\lambda_k)}^{r_k}

有准素分解:

V=V1V2VkV=V_1\oplus V_2\oplus\cdots\oplus V_k

其中:

Vi=N((AλiI)ri)V_i=N\left({(A-\lambda_i I)}^{r_i}\right)

式中 AATT 对应的矩阵。

令变换 SiS_iTTViV_i 上的限制 TVi{T|}_{V_i},接下来试图对每一个 SiS_i 进行 Jordan 分解。

TeT_eVV 上的恒等变换。与前文的 Jordan 分解不同,记 TiT_iSiS_i 的 Jordan 分解中的幂零部分:

Si=λiTe+TiS_i=\lambda_i T_e+T_i

于是 TiT_i 为子空间 ViV_i 的一个幂零变换,事实上也是 TλiTeT-\lambda_i T_eViV_i 上的限制 (TλiTe)Vi{(T-\lambda_i T_e)|}_{V_i}

子空间 ViV_i 可以分解为幂零变换 TiT_i 循环子空间的直和:

Vi=Wi1Wi2WisiV_i=W_{i1}\oplus W_{i2}\oplus\cdots\oplus W_{is_i}

在每一个循环子空间 WijW_{ij} 里,取一个循环基并倒序排列,凑成 ViV_i 的一个基,于是 TiT_i 关于这个基的矩阵有形状:

Ni=(Ni10Ni20Nisi)N_i=\begin{pmatrix} N_{i1} & & & 0\\ & N_{i2} & & \\ & & \ddots & \\ 0 & & & N_{is_i}\\ \end{pmatrix}

全体 NijN_{ij} 均为幂零 Jordan 块。于是对于 ViV_i 上述选取的基,SiS_i 对应的矩阵是:

Bi=(λi0λi0λi)+(Ni10Ni20Nisi)=(Ji10Ji20Jisi)B_i=\begin{pmatrix} \lambda_i & & & 0\\ & \lambda_i & & \\ & & \ddots & \\ 0 & & & \lambda_i\\ \end{pmatrix}+\begin{pmatrix} N_{i1} & & & 0\\ & N_{i2} & & \\ & & \ddots & \\ 0 & & & N_{is_i}\\ \end{pmatrix}=\begin{pmatrix} J_{i1} & & & 0\\ & J_{i2} & & \\ & & \ddots & \\ 0 & & & J_{is_i}\\ \end{pmatrix}

这里 Ji1,Ji2,,JisiJ_{i1},J_{i2},\cdots,J_{is_i} 都是属于 λi\lambda_i 的 Jordan 块。

对于每一个子空间 ViV_i,按照以上方式选取一个基,凑起来成为 VV 的基,那么 TT 关于这个基的矩阵即构成定理规定的形式。

形如:

(J10J20Jm)\begin{pmatrix} J_1 & & & 0\\ & J_2 & & \\ & & \ddots & \\ 0 & & & J_m\\ \end{pmatrix}

nn 阶矩阵,其中每一个 JiJ_i 都是一个 Jordan 块,叫做一个 Jordan 标准型。

定理:每一个 nn 阶矩阵 AA 都与一个 Jordan 标准型相似。除了各个 Jordan 块排列的次序以外,与 AA 相似的 Jordan 标准型是由 AA 唯一确定的。

注意在上述构造的矩阵 BiB_i 中,第一项是一个单位阵的若干倍,自然可以和第二项交换。因此,第一项就是 BiB_i 的 Jordan 分解的可对角化部分,第二项就是 BiB_i 的 Jordan 分解的幂零部分。

在一个矩阵对应的 Jordan 标准型里面,主对角线上的元素构成的对角阵是这个矩阵对应的 Jordan 标准型的可对角化部分,把主对角线上的元素换成 00 就得到这个矩阵对应的 Jordan 标准型的幂零部分。

定理:对于矩阵 AA 的 Jordan 标准型中,每一个 Jordan 块:

Ji=(λi1λi11λi)J_i=\begin{pmatrix} \lambda_i & 1 & & & \\ & \lambda_i & 1 & & \\ & & \ddots & \ddots & \\ & & & \ddots & 1\\ & & & & \lambda_i\\ \end{pmatrix}

对应于特征矩阵 λIA\lambda I-A 的一个初等因子 (λλi)ni{(\lambda-\lambda_i)}^{n_i},特征矩阵 λIA\lambda I-A 的全体初等因子对应于矩阵 AA 的 Jordan 标准型中的全体 Jordan 块。

这是因为,矩阵 AA 相似于它的 Jordan 标准型,因此两者的特征矩阵也等价,将 Jordan 标准型的特征矩阵化为 Smith 标准型即可看出。

由这个定理,借助特征矩阵 λIA\lambda I-A 的初等因子,可以写出矩阵 AA 的 Jordan 标准型。

一个推论是,矩阵 AA 可对角化,等价于特征矩阵 λIA\lambda I-A 的初等因子均为一次的。

弗罗贝尼乌斯(Forbenious)定理

上文指出,nn 阶特征矩阵的 Smith 标准形的秩为 nn

定理:设矩阵 AA 的特征矩阵 λIA\lambda I-A 的 Smith 标准形为:

diag{d1(λ),d2(λ),,dn(λ)}\operatorname{diag}\{d_1(\lambda),d_2(\lambda),\cdots,d_n(\lambda)\}

则最后一个不变因子 dn(λ)d_n(\lambda) 恰好为矩阵 AA 的最小多项式 mA(λ)m_A(\lambda)

推论:矩阵 AA 可对角化的等价条件为:

  • 最小多项式 mA(λ)m_A(\lambda) 无重根。
  • 特征矩阵 λIA\lambda I-A 的不变因子无重根。
  • 特征矩阵 λIA\lambda I-A 的初等因子均为一次的。
中等 (500)