线性映射
线性映射的概念
- 线性映射(linear mapping)
- U,V是数域F上的线性空间,且$ \mathscr A:U\to V $ 是映射,如果该映射满足以下两条,那么这个映射是 线性映射:
- $ \forall a_1,a_2\in U,\mathscr A(a_1+a_2)=\mathscr A(a_1)+\mathscr A(a_2) $
- $ \forall a\in U,\lambda \in F,\mathscr A(\lambda a)=\lambda\mathscr A(a) $
- 线性变换(linear transformation)
- 如果$ \mathscr A:V\to V $是线性映射,叫做 线性变换
以下是线性映射的一些例子:
- $\mathscr A: F^{n\times 1} \to F^{m\times 1}$,这种情况下,一定可以用矩阵乘法实现$\mathscr A: X \to AX$(TH)
- V是F上的线性空间,$a_1,a_2,…,a_n \in V,\mathscr A: F^{n\times 1} \to V,(x_1,x_2,…,x_n)\to x_1a_1+x_2a_2+…+x_na_n$是线性映射(注意,可能是多对一映射)
- V是F上的线性空间,$a_1,a_2,…,a_n \in V$是一组基,$\mathscr A: V \to F^{n\times 1}, x_1a_1+x_2a_2+…+x_na_n \to (x_1,x_2,…,x_n)$ 是线性映射
- 线性映射 和 同态映射 是同一个概念,其中 可逆的 线性映射 是 同构映射
- $n>m,\mathscr A:F^n \to F^m,(x_1,…,x_m,…,x_n)\to (x_1,…,x_m)$是线性映射叫做 投影(projection),$n>m,\mathscr A:F^m \to F^n,(x_1,…,x_m)\to (x_1,…,x_m,0,…,0)$是线性映射叫做 嵌入(embedding)
- 多项式求导数的操作是线性变换
- $P\in F^{m\times m},Q\in F^{n\times n}, \mathscr A F^{m\times n}\to F^{m\times n},X\to PXQ$是线性变换
TH
可逆的线性变换把直线映射成直线,直线段映射成直线段,平行线映射成平行线
把0向量映射到0向量,负向量映射到负向量
$a_1,a_2,…,a_n$线性相关,则$\mathscr A (a_1),\mathscr A (a_2),…,\mathscr A (a_n)$线性相关
$\mathscr A (a_1),\mathscr A (a_2),…,\mathscr A (a_n)$线性无关,则$a_1,a_2,…,a_n$线性无关
线性映射的矩阵
U,V是F上的有限维线性空间,基分别是$M1=(a_1,a_2,…,a_n),M2=(b_1,b_2,…,b_m)$
$\forall a\in U,b\in V$
有线性映射$\mathscr A: U\to V$
显然$\exists A_j,\mathscr A(a_j)=(b_1,b_2,…,b_m)A_j$
那么$\mathscr A(a_1,a_2,…,a_n)=(b_1,b_2,…,b_m)A$
这里的A称作 $\mathscr A$在基$M_1,M_2$下的矩阵(matrix of $\mathscr A$ with respect to bases $M_1,M_2$)
$\forall a \in U,b=\mathscr A(a)\in V$,a,b都可以用各自空间中的基线性表示,
我们知道\(a=(a_1,a_2,...,a_n)\left(\begin{array}{c}x_1\\x_2\\...\\x_n \end{array}\right),b=(b_1,b_2,...,b_n)\left(\begin{array}{c}y_1\\y_2\\...\\y_n \end{array}\right)\)
就有这个结论:
\(\left(\begin{array}{c}y_1\\y_2\\...\\y_n \end{array}\right)=A \left(\begin{array}{c}x_1\\x_2\\...\\x_n \end{array}\right)\)
TH
U,V是F上的线性空间,$M=(a_1,a_2,…,a_n)$是U的一组基,且U是n维的,$(b_1,b_2,…,b_n)$是V上的任意n个向量,那么存在唯一的线性映射$\mathscr A:U\to V$,将$a_1,a_2,…,a_n$映射到$b_1,b_2,…,b_n$
推论:U,V是F上的线性空间,且U是n维的,$M=(a_1,a_2,…,a_k)$是U的一组线性无关向量,$(b_1,b_2,…,b_n)$是V上的任意k个向量,那么,
- 如果k=n存在唯一的线性映射$\mathscr A:U\to V$,将$a_1,a_2,…,a_n$映射到$b_1,b_2,…,b_n$
- 如果k<n,$\mathscr A$不唯一
更宏观的视角
U,V分别是数域F上的的n维和m维线性空间。把U到V的全体线性映射记做$L(U,V)$,那么
$L(U,V)$与$F^{m\times n}$有一个一一对应关系。
进一步地,在$L(U,V)$上定义一些运算
- $\mathscr{A+B}:U\to V,a\to \mathscr{A(a)+B(a)}$
- $\lambda\mathscr A:U\to V,a\to\lambda \mathscr A(a)$
显然,满足线性空间的8个基本定理,是 线性空间
而且,根据上面的讨论,$L(U,V)$与$F^{m\times n}$同构
除此之外,还可以定义 线性映射的乘法
$\mathscr A:U\to V,\mathscr B:V\to W$
那么定义乘法$\mathscr{BA}:U\to W,a\to \mathscr{B(A(a))}$
坐标变换
线性映射的矩阵定理推导过程中,涉及到同一向量在同一空间的不同基下的坐标关系,
$M_1,M_2$是V的两个基,$M_2=M_1 P$,某个向量在两组基下的坐标分别是$X_1,X_2$,那么$X_2=X_1P^{-1}$
像与核
U,V是数域F上的线性空间,$\mathscr A:U\to V$是 线性映射
那么,
集合$\mathscr A (U)$叫做$\mathscr A$的 像(image),或者 值域(range),记做$\mathrm{Im} \mathscr A$
集合$\mathscr A^{-1}(0)$叫做$\mathscr A$的 核(kernel),记做$\mathrm{Ker} \mathscr A$
记$rank\mathscr A=\dim \mathrm{Im} \mathscr A$
TH
- $\mathrm{Im} \mathscr A$是V的 子空间 ,$\mathrm{Ker} \mathscr A$是U的 子空间
- $\dim U=\dim \mathrm{Im} \mathscr A+\dim \mathrm{Ker} \mathscr A$
TH
$A\in F^{m\times n}$是$\mathscr A:U\to V$在任意一对基下的矩阵,
那么,
$rank A = rank \mathscr A$
如果\(V_A=\{X\in F^n \mid AX=0\}\),那么$\dim V_A=\dim \mathrm{Ker} \mathscr A$
证明提要:
记$\sigma_1:U\to F^m,\sigma_2:V\to F^n$,都是同构映射
记A的各列是$A_j$,那么,
就有\(\sigma_2(\mathrm{Im} \{AX\mid X\in F^n\})=\{\sum x_i A_i \mid x_i\in F\}=V(A_1,...,A_n)\),根据 同构 的性质,得出第一个结论
\(\sigma_1(\mathrm{Ker}\mathscr A)=\{X\in F^n\mid AX=0\}=V_A\)
- 单射和满射(概念复习)
- $\sigma:S_1\to S_2$单射意思是:$\sigma(a)=\sigma(b)\Rightarrow a=b$
满射的意思是$\sigma(S_1)=S_2$
既是单射又是满射的映射叫做可逆映射(一一映射)
TH
对于线性映射$\mathscr A$,是单射的充分必要条件是$\mathrm{Ker} \mathscr A=0$
TH
对于线性映射$\mathscr A:U\to V$,$\mathscr A$是可逆映射的充分必要条件是一下任意两个条件成立:
- $\dim U=\dim V=n$
- $\mathrm{Ker}\mathscr{A}=0$
- $\mathrm{Im}\mathscr{A}=V$
线性变换
前面写了,$\mathscr A:V\to V$这样的线性映射,叫做 线性变换
还是先看线性映射,假如$\mathscr A:U\to V$,U下有两组基$M_1,M_2$,V下有两组基$N_1,N_2$
假设$\mathscr A$在基$M_1,N_1$下的矩阵是A,在基$M_2,N_2$下的矩阵为B
$M_1,N_1$的过渡矩阵为P,$M_2,N_2$的过渡矩阵为Q,
那么,
$B=Q^{-1}AP$
线性映射中,$U=V,M_1=N_1,M_2=N_2$,
就有,
$B=P^{-1}AP$
这个关系叫做 相似(similiar)
TH
$A,B\in F^{m\times n}$相似当且仅当他们是同一线性空间V在同一线性变换下两组基的的矩阵。
相似有以下性质:
- 反身性
- 对称性
- 传递性
特征值
上面知道,$\mathscr A:V\to V$ 在不同的基下对应不同的矩阵,这些矩阵相似。
那么,有没有合适的基,使得在这组基下的矩阵尽量简单呢?
最简单的矩阵是对角阵,问题变成A能否对角化。
这就引入特征值和特征向量的概念。
特征子空间
- 特征子空间(eigensubspace)
- $\lambda_0\in F$是矩阵$A\in F^{m\times n}$的特征值,
那么,\(V_{\lambda_0}=\{X\in F \mid (A-\lambda_0 I)X=0\}\)是$F^m$的 子空间,叫做A从属于$\lambda_0$的 特征子空间
$\lambda_0\in F$是$\mathscr A:V\to V$的特征值, 那么,\(V_{\lambda_0}=\{a\in V \mid \mathscr A(a)=\lambda_0 a\}=\mathrm{Ker}(\mathscr A-\lambda_0 \mathscr I)\)
TH
- $\mathscr A:V\to V$从属于不同特征值$\lambda_i$的特征子空间的和是直和
- 几何重数(geometric multiplicity),代数重数
- $\mathscr A$从属于$\lambda_i$的特征子空间$V_{\lambda_i}$,其维度叫做 几何重数
特征多项式$\phi_{\mathscr A}(\lambda_i)$的重数叫做 代数重数
TH
- 几何重数不多于代数重数
- 可对角化的充要条件是,每个特征值的 代数重数 等于 几何重数
参考文献
李尚志《线性代数》