线性映射

研究线性映射是研究线性空间之间的映射。

线性映射可以表示为矩阵的形式，所以在线性映射中矩阵中的大量概念都可以找到对应关系。

线性映射与线性变换

设 $V$ 和 $W$ 是域 $F$ 上的两个线性空间， $T$ 是 $V$ 到 $W$ 的一个映射。

如果对于 $W$ 中任意的向量 $x$ 和 $y$ ，域 $F$ 中任意的标量 $k$ 和 $l$ ，有：

T(kx+ly)=kTx+lTy

称 $T$ 是 $V$ 到 $W$ 的一个线性映射。如果 $W=V$ ，则称 $T$ 是 $V$ 上的一个线性变换。

例如，恒等变换 $T_e$ 保持空间不变，零变换 $T_0$ 将空间映射至零空间。

可以记 $L(V,W)$ 为所有 $V$ 到 $W$ 的线性映射构成的集合。对于全体线性变换 $L(V,V)$ ，也记为 $L(V)$ 。

性质

线性映射将零向量映射到零向量。
线性映射保持线性运算形式不变，即，线性运算的线性映射，等于线性映射的线性运算。
线性映射保持线性相关性，即，映射前线性相关，映射后也线性相关。

但是线性映射不保持线性无关性。映射前线性无关，映射后不一定线性无关。

线性映射的矩阵表示

设 $V$ 的维数是 $n$ ， $V$ 的一组基为 $\alpha_1,\cdots,\alpha_n$ ， $W$ 的维数是 $m$ ， $W$ 的一组基为 $\beta_1,\cdots,\beta_m$ ， $T$ 是 $V$ 到 $W$ 的一个线性映射。

将每个 $\alpha$ 经由 $T$ 映射后的向量用 $\beta$ 表示：

T\alpha_j=a_{1j}\beta_1+\cdots+a_{mj}\beta_m

采用矩阵记法：

T(\alpha_1,\cdots,\alpha_n)=(T\alpha_1,\cdots,T\alpha_n)=(\beta_1,\cdots,\beta_m)A

称矩阵 $A$ 为线性映射 $T$ 在这两组基下的矩阵表示。

线性映射的核空间与像空间

这里的核空间与像空间是站在线性映射的视角下叙述的。借助矩阵表示可以看出，线性映射的核空间与像空间与矩阵的核空间与像空间是一致的。

设 $T$ 是由空间 $V$ 到空间 $W$ 的线性映射，令：

N(T)=\{x\in V|Tx=0\}

R(T)=Im(T)=\{y\in W|y=Tx,Vx\in V\}

易验证 $N(T)$ 为 $V$ 的子空间， $R(T)$ 为 $W$ 的子空间，称 $N(T)$ 及 $R(T)$ 为 $V$ 的核空间和像空间，并称 $N(T)$ 的维数为 $T$ 的零度或亏， $R(T)$ 的维数为 $T$ 的秩。

定理：设 $T$ 是由空间 $V$ 到空间 $W$ 的线性映射， $V$ 的维数有限，则 $N(T)$ 及 $R(T)$ 均为有限维，且有：

\operatorname{dim} N(T)+\operatorname{dim} R(T)=\operatorname{dim} V

即 $T$ 的亏加秩等于其定义域 $V$ 的维数。

线性变换的矩阵表示

设 $V$ 的维数是 $n$ ， $V$ 的一组基为 $\alpha_1,\cdots,\alpha_n$ ， $T$ 是 $V$ 上的一个线性变换，则有：

T\alpha_j=a_{1j}\alpha_1+\cdots+a_{nj}\alpha_n

采用矩阵记法：

T(\alpha_1,\cdots,\alpha_n)=(T\alpha_1,\cdots,T\alpha_n)=(\alpha_1,\cdots,\alpha_n)A

称矩阵 $A$ 为线性变换 $T$ 在这组基下的矩阵表示。

由空间结构和 $T$ 的线性性质， $T$ 由 $T\alpha_1,\cdots,T\alpha_n$ 完全确定，故由 $T$ 唯一确定一个矩阵 $A$ 。

定理：设 $V$ 的维数是 $n$ ， $\alpha_1,\cdots,\alpha_n$ 为 $V$ 的一组基，任取 $n$ 阶方阵 $A$ ，有且仅有一个从 $V$ 到 $V$ 的线性变换 $T$ ，使得 $T$ 的矩阵恰好为 $A$ 。

推论：在 $L(V,V)$ 和全体 $n$ 阶方阵之间存在一一对应关系。

例如：零变换对应零矩阵，恒等变换对应单位矩阵。

线性变换构成的空间

定理： $L(V)$ 也可以构成线性空间，引入 $L(V)$ 中的运算：对于 $L(V)$ 中任意的 $T_1$ 与 $T_2$ ， $V$ 中任意的 $x$ ，域 $F$ 中任意的 $k$ ，有：

(T_1+T_2)x=T_1x+T_2x

(kT_1)x=k(T_1x)

容易验证 $L(V)$ 是 $F$ 上的一个线性空间，即线性变换空间。

对于 $L(V)$ 中的线性变换 $T_1$ 与 $T_2$ ，定义 $T_1$ 与 $T_2$ 的乘积 $T_1T_2$ 为：

(T_1T_2)x=T_2(T_1x)

可以验证 $(T_1T_2)$ 也是 $L(V)$ 中的线性变换，并且线性变换的乘积满足结合律，而不满足交换律，与矩阵的乘积类似。

对于 $L(V)$ 中的线性变换 $T_1$ ，如果 $L(V)$ 中的线性变换 $T_2$ ，使得对于 $V$ 中任意的向量 $x$ ，有：

(T_1T_2)x=T_1(T_2x)=x

则称 $T_2$ 是 $T_1$ 的逆变换，记作：

T_2=T_1^{-1}

且有：

T_1T_2=T_2T_1=T_e

定理：设 $V$ 的维数为 $n$ ， $\alpha_1,\cdots,\alpha_n$ 为 $V$ 的一组基，在这组基下线性变换 $T_1$ 的矩阵为 $A$ ， $T_2$ 的矩阵为 $B$ ，则：

线性变换 $T_1+T_2$ 的矩阵为 $A+B$
线性变换的数乘 $kT_1$ 的矩阵为 $kA$
线性变换的乘积 $T_1T_2$ 的矩阵为 $AB$
线性变换 $T_1$ 的逆变换若存在，矩阵为 $A^{-1}$

坐标

设 $n$ 个向量 $x$ 是 $n$ 维空间 $V$ 的一个基，对于 $V$ 中任意的向量 $y$ ，令 $y$ 为：

y=a_1x_1+a_2x_2+\cdots+a_nx_n=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_1\\a_2\\\vdots\\a_n\end{pmatrix}

称列向量：

\begin{pmatrix}a_1\\a_2\\\vdots\\a_n\end{pmatrix}

为向量 $y$ 在基 $x_1,x_2,\cdots,x_n$ 下的坐标。

可见，坐标是由域中的标量构成的列向量，与阿贝尔群中的向量应当进行区分。

坐标变换公式

设 $V$ 的维数为 $n$ ， $L(V)$ 中有变换 $T$ ， $T$ 在基 $\alpha_1,\cdots,\alpha_n$ 下的矩阵为 $A$ 。设：

\xi=(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}

且有：

T\xi=T(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}

则有：

T\xi=T(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=(\alpha_1,\cdots,\alpha_n)A\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}

空间 $V$ 中的列向量点本质上都是「基乘坐标」的形式。空间 $V$ 中的列向量点 $x$ ，本身用了单位阵 $I$ 作为基，即 $x=Ix$ 。

只有同一个基，基不动的时候，单纯的线性变换 $T$ ，就是坐标左乘普通矩阵。

把线性变换 $T$ 看成对于空间 $V$ 的一个观测滤镜。线性变换 $T$ 的作用对象是空间 $V$ ，将空间 $V$ 扭曲了。加了滤镜之后，点本身的位置没有变。

这个定理也说明，对于列向量基的线性变换 $T$ ，等价于对于基右乘一个过渡矩阵。

于是，在不同的基之间，坐标关系是左乘过渡矩阵的逆矩阵。

过渡矩阵

设 $n$ 个向量 $x$ 与 $n$ 个向量 $y$ 是空间 $V$ 的两组基。对于 $1\leq i\leq n$ ，令每个向量 $y_i$ 在基 $x_1,x_2,\cdots,x_n$ 下的坐标为：

y_i=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_{1i}\\a_{2i}\\\vdots\\a_{ni}\end{pmatrix}

于是 $n$ 个向量 $y$ 排成等式左边的矩阵， $n$ 个坐标排成等式右边的矩阵 $A$ ：

(y_1,y_2,\cdots,y_n)=(x_1,x_2,\cdots,x_n)A

矩阵 $A$ 称为由基 $x_1,x_2\cdots,x_n$ 到基 $y_1,y_2\cdots,y_n$ 的 过渡矩阵，也称为变换矩阵。

显然过渡矩阵可逆。对于上式，由基 $y_1,y_2\cdots,y_n$ 到基 $x_1,x_2\cdots,x_n$ 的过渡矩阵为 $A^{-1}$ 。

可见，过渡矩阵是由域中的标量构成的矩阵，并非阿贝尔群中的向量排成的矩阵，应当予以区分。

设 $n$ 个向量 $x$ 与 $n$ 个向量 $y$ 是空间 $V$ 的两组基。对于空间 $V$ 中的同一个向量 $z$ ，有：

z=(x_1,x_2,\cdots,x_n)\begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix}=(y_1,y_2\cdots,y_n)\begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix}

代入上文的

(y_1,y_2\cdots,y_n)=(x_1,x_2\cdots,x_n)A

由唯一性，得到：

\begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix}=A\begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix}

或者

\begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix}=A^{-1}\begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix}

这是纯粹坐标之间的变换，坐标变换公式均在标量域中。由于前文做了区分，线性空间与阿贝尔群中的向量是「抽象的向量」，而坐标与过渡矩阵的元素均在标量域中，视为「具体的向量」，两种向量应当视为「不同的东西」。

矩阵可以对整个空间，即全体坐标进行变换，列向量 $x$ 作为坐标遍布整个空间。

单位矩阵 $I$ 由单位向量构成。矩阵 $A$ 会将单位矩阵 $I$ 变换到矩阵 $A$ 的每个列向量，即将单位向量变换到矩阵 $A$ 的每个列向量。因此左乘矩阵 $A$ ，也可以视为将空间做了这样的变换。

向量左乘矩阵，也可以视为坐标左乘向量组。用坐标的观点看待就是：

Iy=Xa

同一个列向量 $y$ ，在「正常」的空间，单位矩阵 $I$ 代表的空间下，坐标为 $y$ ，在变换后新的空间里，坐标将记为 $a$ 。这样一来，矩阵 $X$ 不仅是正常空间下的一组基，也是从向量组 $I$ 到向量组 $X$ 的过渡矩阵。

线性变换 $T$ 会将一个基映射为另一个基，于是坐标也被映射为另一个坐标。

如果将基 $\alpha$ 映射到 $\beta$ 对应的线性变换 $T$ 的过渡矩阵是 $A$ ，那么对应的基矩阵就有 $\beta=\alpha A$ 。

于是坐标的关系恰好反过来。假设线性变换 $T$ 映射后的坐标是 $b$ ，即加滤镜后观察到坐标 $b$ ，于是点在 $V$ 的表示就是 $\beta b$ 。还原的办法就是用过渡矩阵，把点在 $V$ 的表示写成 $\alpha Ab$ 。于是坐标变换为左乘过渡矩阵的逆矩阵的看法就明显了。

线性变换与矩阵相似

在空间 $V$ 中的一个线性变换 $T$ 对于空间 $V$ 的基 $\alpha$ 的关系：

线性变换 $T$ 作用于基 $\alpha$ ，将基 $\alpha$ 映射到了 $T(\alpha)$ ，相当于在基 $\alpha$ 右乘一个 $A$ ，即 $T(\alpha)=\alpha A$ 。

矩阵相似考虑的问题是：同一个线性变换 $T$ ，在基 $\beta$ 的空间 $V$ 中描述为矩阵 $B$ ，在基 $\alpha$ 的空间 $V$ 中描述为矩阵 $A$ 。

如果过渡矩阵为 $C$ ，即 $\beta=\alpha C$ ，那么两个描述 $B$ 和 $A$ 之间有怎样的联系。

由于是同一个变换 $T$ ，可以发现一个事实，变换前后的过渡矩阵关系始终成立，即：

T(\beta)=T(\alpha)C=\alpha AC

线性变换 $T$ 在基 $\beta$ 视角下仍旧为右乘，基 $\beta$ 转化到基 $\alpha$ 再右乘一个 $C$ ，变换前后保持过渡矩阵 $C$ 的关系：

T(\beta)=\beta B=\alpha CB

于是问题得到解决：

B=C^{-1}AC

定理：设 $L(V)$ 中有变换 $T$ ，则 $T$ 在不同基下的矩阵相似。

对于方阵 $A$ 和方阵 $B$ ，如果存在可逆矩阵 $C$ 使得 $B=C^{-1}AC$ ，则 $A$ 和 $B$ 相似。

矩阵相似保持秩不变，因此矩阵相似可以推出矩阵等价。但是，等价的两个矩阵未必相似。

由于矩阵相似与形状密切相关，因此矩阵相似和向量组等价、方程组同解之间没有关系。

回过头来，矩阵相似的解释就是 4 个等式： $\beta=\alpha C$ 、 $T(\alpha)=\alpha A$ 、 $T(\beta)=\beta B$ 、 $T(\beta)=T(\alpha)C$ 。

参考资料

【官方双语/合集】线性代数的本质 - 系列合集 P13 09 - 基变换

线性映射与线性变换​

性质​

线性映射的矩阵表示​

线性映射的核空间与像空间​

线性变换的矩阵表示​

线性变换构成的空间​

坐标​

坐标变换公式​

过渡矩阵​

线性变换与矩阵相似​

参考资料​