跳到主要内容

线性映射

研究线性映射是研究线性空间之间的映射。

线性映射可以表示为矩阵的形式,所以在线性映射中矩阵中的大量概念都可以找到对应关系。

线性映射与线性变换

VVWW 是域 FF 上的两个线性空间,TTVVWW 的一个映射。

如果对于 WW 中任意的向量 xxyy,域 FF 中任意的标量 kkll,有:

T(kx+ly)=kTx+lTyT(kx+ly)=kTx+lTy

TTVVWW 的一个线性映射。如果 W=VW=V,则称 TTVV 上的一个线性变换。

例如,恒等变换 TeT_e 保持空间不变,零变换 T0T_0 将空间映射至零空间。

可以记 L(V,W)L(V,W) 为所有 VVWW 的线性映射构成的集合。对于全体线性变换 L(V,V)L(V,V),也记为 L(V)L(V)

性质

  • 线性映射将零向量映射到零向量。
  • 线性映射保持线性运算形式不变,即,线性运算的线性映射,等于线性映射的线性运算。
  • 线性映射保持线性相关性,即,映射前线性相关,映射后也线性相关。

但是线性映射不保持线性无关性。映射前线性无关,映射后不一定线性无关。

线性映射的矩阵表示

VV 的维数是 nnVV 的一组基为 α1,,αn\alpha_1,\cdots,\alpha_nWW 的维数是 mmWW 的一组基为 β1,,βm\beta_1,\cdots,\beta_mTTVVWW 的一个线性映射。

将每个 α\alpha 经由 TT 映射后的向量用 β\beta 表示:

Tαj=a1jβ1++amjβmT\alpha_j=a_{1j}\beta_1+\cdots+a_{mj}\beta_m

采用矩阵记法:

T(α1,,αn)=(Tα1,,Tαn)=(β1,,βm)AT(\alpha_1,\cdots,\alpha_n)=(T\alpha_1,\cdots,T\alpha_n)=(\beta_1,\cdots,\beta_m)A

称矩阵 AA 为线性映射 TT 在这两组基下的矩阵表示。

线性映射的核空间与像空间

这里的核空间与像空间是站在线性映射的视角下叙述的。借助矩阵表示可以看出,线性映射的核空间与像空间与矩阵的核空间与像空间是一致的。

TT 是由空间 VV 到空间 WW 的线性映射,令:

N(T)={xVTx=0}N(T)=\{x\in V|Tx=0\} R(T)=Im(T)={yWy=Tx,VxV}R(T)=Im(T)=\{y\in W|y=Tx,Vx\in V\}

易验证 N(T)N(T)VV 的子空间,R(T)R(T)WW 的子空间,称 N(T)N(T)R(T)R(T)VV 的核空间和像空间,并称 N(T)N(T) 的维数为 TT零度R(T)R(T) 的维数为 TT

定理:设 TT 是由空间 VV 到空间 WW 的线性映射,VV 的维数有限,则 N(T)N(T)R(T)R(T) 均为有限维,且有:

dimN(T)+dimR(T)=dimV\operatorname{dim} N(T)+\operatorname{dim} R(T)=\operatorname{dim} V

TT 的亏加秩等于其定义域 VV 的维数。

线性变换的矩阵表示

VV 的维数是 nnVV 的一组基为 α1,,αn\alpha_1,\cdots,\alpha_nTTVV 上的一个线性变换,则有:

Tαj=a1jα1++anjαnT\alpha_j=a_{1j}\alpha_1+\cdots+a_{nj}\alpha_n

采用矩阵记法:

T(α1,,αn)=(Tα1,,Tαn)=(α1,,αn)AT(\alpha_1,\cdots,\alpha_n)=(T\alpha_1,\cdots,T\alpha_n)=(\alpha_1,\cdots,\alpha_n)A

称矩阵 AA 为线性变换 TT 在这组基下的矩阵表示。

由空间结构和 TT 的线性性质,TTTα1,,TαnT\alpha_1,\cdots,T\alpha_n 完全确定,故由 TT 唯一确定一个矩阵 AA

定理:设 VV 的维数是 nnα1,,αn\alpha_1,\cdots,\alpha_nVV 的一组基,任取 nn 阶方阵 AA,有且仅有一个从 VVVV 的线性变换 TT,使得 TT 的矩阵恰好为 AA

推论:在 L(V,V)L(V,V) 和全体 nn 阶方阵之间存在一一对应关系。

例如:零变换对应零矩阵,恒等变换对应单位矩阵。

线性变换构成的空间

定理:L(V)L(V) 也可以构成线性空间,引入 L(V)L(V) 中的运算:对于 L(V)L(V) 中任意的 T1T_1T2T_2VV 中任意的 xx,域 FF 中任意的 kk,有:

(T1+T2)x=T1x+T2x(T_1+T_2)x=T_1x+T_2x (kT1)x=k(T1x)(kT_1)x=k(T_1x)

容易验证 L(V)L(V)FF 上的一个线性空间,即线性变换空间。

对于 L(V)L(V) 中的线性变换 T1T_1T2T_2,定义 T1T_1T2T_2 的乘积 T1T2T_1T_2 为:

(T1T2)x=T2(T1x)(T_1T_2)x=T_2(T_1x)

可以验证 (T1T2)(T_1T_2) 也是 L(V)L(V) 中的线性变换,并且线性变换的乘积满足结合律,而不满足交换律,与矩阵的乘积类似。

对于 L(V)L(V) 中的线性变换 T1T_1,如果 L(V)L(V) 中的线性变换 T2T_2,使得对于 VV 中任意的向量 xx,有:

(T1T2)x=T1(T2x)=x(T_1T_2)x=T_1(T_2x)=x

则称 T2T_2T1T_1 的逆变换,记作:

T2=T11T_2=T_1^{-1}

且有:

T1T2=T2T1=TeT_1T_2=T_2T_1=T_e

定理:设 VV 的维数为 nnα1,,αn\alpha_1,\cdots,\alpha_nVV 的一组基,在这组基下线性变换 T1T_1 的矩阵为 AAT2T_2 的矩阵为 BB,则:

  • 线性变换 T1+T2T_1+T_2 的矩阵为 A+BA+B
  • 线性变换的数乘 kT1kT_1 的矩阵为 kAkA
  • 线性变换的乘积 T1T2T_1T_2 的矩阵为 ABAB
  • 线性变换 T1T_1 的逆变换若存在,矩阵为 A1A^{-1}

坐标

nn 个向量 xxnn 维空间 VV 的一个基,对于 VV 中任意的向量 yy,令 yy 为:

y=a1x1+a2x2++anxn=(x1,x2,,xn)(a1a2an)y=a_1x_1+a_2x_2+\cdots+a_nx_n=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_1\\a_2\\\vdots\\a_n\end{pmatrix}

称列向量:

(a1a2an)\begin{pmatrix}a_1\\a_2\\\vdots\\a_n\end{pmatrix}

为向量 yy 在基 x1,x2,,xnx_1,x_2,\cdots,x_n 下的 坐标

可见,坐标是由域中的标量构成的列向量,与阿贝尔群中的向量应当进行区分。

坐标变换公式

VV 的维数为 nnL(V)L(V) 中有变换 TTTT 在基 α1,,αn\alpha_1,\cdots,\alpha_n 下的矩阵为 AA。设:

ξ=(α1,,αn)(x1x2xn)\xi=(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}

且有:

Tξ=T(α1,,αn)(y1y2yn)T\xi=T(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}

则有:

Tξ=T(α1,,αn)(y1y2yn)=(α1,,αn)A(x1x2xn)T\xi=T(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=(\alpha_1,\cdots,\alpha_n)A\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}

空间 VV 中的列向量点本质上都是「基乘坐标」的形式。空间 VV 中的列向量点 xx,本身用了单位阵 II 作为基,即 x=Ixx=Ix

只有同一个基,基不动的时候,单纯的线性变换 TT,就是坐标左乘普通矩阵。

把线性变换 TT 看成对于空间 VV 的一个观测滤镜。线性变换 TT 的作用对象是空间 VV,将空间 VV 扭曲了。加了滤镜之后,点本身的位置没有变。

这个定理也说明,对于列向量基的线性变换 TT,等价于对于基右乘一个过渡矩阵。

于是,在不同的基之间,坐标关系是左乘过渡矩阵的逆矩阵。

过渡矩阵

nn 个向量 xxnn 个向量 yy 是空间 VV 的两组基。对于 1in1\leq i\leq n,令每个向量 yiy_i 在基 x1,x2,,xnx_1,x_2,\cdots,x_n 下的坐标为:

yi=(x1,x2,,xn)(a1ia2iani)y_i=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_{1i}\\a_{2i}\\\vdots\\a_{ni}\end{pmatrix}

于是 nn 个向量 yy 排成等式左边的矩阵,nn 个坐标排成等式右边的矩阵 AA

(y1,y2,,yn)=(x1,x2,,xn)A(y_1,y_2,\cdots,y_n)=(x_1,x_2,\cdots,x_n)A

矩阵 AA 称为由基 x1,x2,xnx_1,x_2\cdots,x_n 到基 y1,y2,yny_1,y_2\cdots,y_n过渡矩阵,也称为变换矩阵。

显然过渡矩阵可逆。对于上式,由基 y1,y2,yny_1,y_2\cdots,y_n 到基 x1,x2,xnx_1,x_2\cdots,x_n 的过渡矩阵为 A1A^{-1}

可见,过渡矩阵是由域中的标量构成的矩阵,并非阿贝尔群中的向量排成的矩阵,应当予以区分。

nn 个向量 xxnn 个向量 yy 是空间 VV 的两组基。对于空间 VV 中的同一个向量 zz,有:

z=(x1,x2,,xn)(ξ1ξ2ξn)=(y1,y2,yn)(η1η2ηn)z=(x_1,x_2,\cdots,x_n)\begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix}=(y_1,y_2\cdots,y_n)\begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix}

代入上文的

(y1,y2,yn)=(x1,x2,xn)A(y_1,y_2\cdots,y_n)=(x_1,x_2\cdots,x_n)A

由唯一性,得到:

(ξ1ξ2ξn)=A(η1η2ηn)\begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix}=A\begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix}

或者

(η1η2ηn)=A1(ξ1ξ2ξn)\begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix}=A^{-1}\begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix}

这是纯粹坐标之间的变换,坐标变换公式均在标量域中。由于前文做了区分,线性空间与阿贝尔群中的向量是「抽象的向量」,而坐标与过渡矩阵的元素均在标量域中,视为「具体的向量」,两种向量应当视为「不同的东西」。

矩阵可以对整个空间,即全体坐标进行变换,列向量 xx 作为坐标遍布整个空间。

单位矩阵 II 由单位向量构成。矩阵 AA 会将单位矩阵 II 变换到矩阵 AA 的每个列向量,即将单位向量变换到矩阵 AA 的每个列向量。因此左乘矩阵 AA,也可以视为将空间做了这样的变换。

向量左乘矩阵,也可以视为坐标左乘向量组。用坐标的观点看待就是:

Iy=XaIy=Xa

同一个列向量 yy,在「正常」的空间,单位矩阵 II 代表的空间下,坐标为 yy,在变换后新的空间里,坐标将记为 aa。这样一来,矩阵 XX 不仅是正常空间下的一组基,也是从向量组 II 到向量组 XX 的过渡矩阵。

线性变换 TT 会将一个基映射为另一个基,于是坐标也被映射为另一个坐标。

如果将基 α\alpha 映射到 β\beta 对应的线性变换 TT 的过渡矩阵是 AA,那么对应的基矩阵就有 β=αA\beta=\alpha A

于是坐标的关系恰好反过来。假设线性变换 TT 映射后的坐标是 bb,即加滤镜后观察到坐标 bb,于是点在 VV 的表示就是 βb\beta b。还原的办法就是用过渡矩阵,把点在 VV 的表示写成 αAb\alpha Ab。于是坐标变换为左乘过渡矩阵的逆矩阵的看法就明显了。

线性变换与矩阵相似

在空间 VV 中的一个线性变换 TT 对于空间 VV 的基 α\alpha 的关系:

线性变换 TT 作用于基 α\alpha,将基 α\alpha 映射到了 T(α)T(\alpha),相当于在基 α\alpha 右乘一个 AA,即 T(α)=αAT(\alpha)=\alpha A

矩阵相似考虑的问题是:同一个线性变换 TT,在基 β\beta 的空间 VV 中描述为矩阵 BB,在基 α\alpha 的空间 VV 中描述为矩阵 AA

如果过渡矩阵为 CC,即 β=αC\beta=\alpha C,那么两个描述 BBAA 之间有怎样的联系。

由于是同一个变换 TT,可以发现一个事实,变换前后的过渡矩阵关系始终成立,即:

T(β)=T(α)C=αACT(\beta)=T(\alpha)C=\alpha AC

线性变换 TT 在基 β\beta 视角下仍旧为右乘,基 β\beta 转化到基 α\alpha 再右乘一个 CC,变换前后保持过渡矩阵 CC 的关系:

T(β)=βB=αCBT(\beta)=\beta B=\alpha CB

于是问题得到解决:

B=C1ACB=C^{-1}AC

定理:设 L(V)L(V) 中有变换 TT,则 TT 在不同基下的矩阵 相似

对于方阵 AA 和方阵 BB,如果存在可逆矩阵 CC 使得 B=C1ACB=C^{-1}AC,则 AABB 相似。

矩阵相似保持秩不变,因此矩阵相似可以推出矩阵等价。但是,等价的两个矩阵未必相似。

由于矩阵相似与形状密切相关,因此矩阵相似和向量组等价、方程组同解之间没有关系。

回过头来,矩阵相似的解释就是 4 个等式:β=αC\beta=\alpha CT(α)=αAT(\alpha)=\alpha AT(β)=βBT(\beta)=\beta BT(β)=T(α)CT(\beta)=T(\alpha)C

参考资料

中等 (500)