解方程

线性方程组： $m*n$ 的系数矩阵 $A$ ，长度为 $n$ 的解向量 $x$ ，和长度为 $m$ 的偏置为 $b$ 。需要解 $Ax=b$ 。

矩阵初等变换：

交换两行
某行倍加到另一行上
某行乘非 $0$ 倍数

增广矩阵：把 $A$ 和 $b$ 拼到一起

阶梯型矩阵：从上到下， $0$ 个数逐行严格增加，直到下方的全 $0$ 行

最简阶梯型：在阶梯型的基础上，有两个条件：

每行第一个非 $0$ 元是 $1$
每行第一个非 $0$ 元所在的列，其他行全 $0$

（让我想到高斯-约旦消元法）

在最简阶梯型的基础上，可以调整列的位置关系。使得非全 $0$ 行的个数为 $r$ ，且对于 $i\le r$ ，第 $i$ 行的 $0$ 只存在于长度为 $i-1$ 的前缀。

然后讨论解的状态，先看最后的全 $0$ 行，如果存在一行的偏置非 $0$ ，则无解。

否则一定有解。设 $r$ 是非全 $0$ 行的行数，如果 $r=n$ ，通过回代可以确定唯一解。如果 $r<n$ ，则解无限。

具体的，可以发现确定 $x_{r+1},x_{r+2},\dots,x_n$ 之后， $x_{1\sim r}$ 都可以回代得到。我们称之为，有 $n-r$ 个自由变量。

齐次线性方程组：不存在无解情况，其余讨论基本相同。

我们的讨论都是在数域 $F$ 上进行的，即可以进行加减乘除运算的代数结构。

向量空间

向量空间：包括向量的集合 $A$ 和域 $B$ ，它需要满足：

$A$ 上的加法构成了阿贝尔群。
$A$ 和 $B$ 之间需要定义数乘运算 $\cdot:B×A\rightarrow A$ ，需要满足以下性质：

封闭性： $\forall b\in B,a\in A,ba\in A$

结合律： $\forall b,b'\in B,a\in A$ ，有 $bb'a=b(b'a)$ 。

分配律： $\forall b\in B,a,a'\in A$ ，有 $b(a+a')=ba+ba'$ 。 $\forall b,b'\in B,a\in A$ ，有 $(b+b')a=ba+b'a$ 。

单位元作用： $\forall a\in A,1_B\cdot a=a$ 。

一些记号：设系数矩阵为 $A\in F^{m*n}$ ，解向量为 $x\in F^{n}$ ，我们要解 $Ax=\beta$ 。

设 $A$ 的每一列是 $\alpha_1,\alpha_2,\dots,\alpha_n\in F^m$ ，

可以把 $A$ 记作 $(\alpha_1,\alpha_2,\dots,\alpha_n)$ 。

方程组可以看做 $x_1\alpha_1+x_2\alpha_2+\dots+x_n\alpha_n=\beta$ 。

若 $x_1=k_1,x_2=k_2,\dots,x_n=k_n$ 为解，则 $\beta=k_1\alpha_1+k_2\alpha_2+\dots+k_n\alpha_n$

线性表述

$\beta\in F^m$ 可由 $\alpha_1,\alpha_2,\dots\alpha_s\in F^m$ 线性表述 $\leftrightarrow$ $\beta=x_1\alpha_1+x_2\alpha_2+\dots+x_s\alpha_s$ 有解

线性子空间

对于线性空间 $(A,B,+,\cdot)$ ，若 $A'\subseteq A$ 且满足以下条件：

$\forall \alpha,\beta\in A',\alpha\beta\in A'$ 。

$\forall \alpha \in A',k\in B,k\alpha\in A'$ 。

则 $A'$ 是 $A$ 的子空间。

例子：齐次方程的解空间就是一个子空间。我们称一般方程的解空间为仿射空间。

线性无关

一组向量 $\alpha_1,\alpha_2,\dots,\alpha_n$ 线性相关，当且仅当 $\alpha_1x_1+\dots +\alpha_nx_n=0$ 存在非 $0$ 解。

不是线性相关，那就是线性无关。

注： $\alpha_1,\alpha_2,\dots,\alpha_n$ 能表出 $\beta$ 只是 $\alpha_1,\alpha_2,\dots,\alpha_n,\beta$ 线性相关的充分条件。

例子： $\alpha_1=(1,0,0),\alpha_2=(0,0,0),\beta =(0,1,0)$

性质：

如果这些向量的一个子集线性相关，则所有向量都线性相关
若 $s>n$ ，则 $\alpha_1,\alpha_2,\dots,\alpha_s\in F^n$ 必线性相关
向量组相关，则其缩短组相关，向量组无关，则其延伸组无关

极大无关组

对于向量组 $\{\alpha_1,\alpha_2,\dots,\alpha_m\}$ ，它的一个极大无关组 $\alpha_{i_1},\alpha_{i_2},\dots,\alpha_{i_r}$ 满足：

$\alpha_{i_1},\alpha_{i_2},\dots,\alpha_{i_r}$ 无关
$\forall 1\le i\le m$ ， $\alpha_{i_1},\alpha_{i_2},\dots,\alpha_{i_r},\alpha_i$ 线性相关

条件 $2$ 和 $\alpha_1,\alpha_2,\dots,\alpha_{m}$ 均可被 $\alpha_{i_1},\alpha_{i_2},\dots,\alpha_{i_r}$ 线性表出等价。

性质：含有非 $0$ 的向量组，极大无关组必存在

向量组的等价关系

对于向量组 $I_1,I_2$ ，称 $I_1$ 能被 $I_2$ 线性表出，当且仅当 $\forall \alpha\in I_1$ ， $\alpha$ 能被 $I_2$ 线性表出。

$I_1,I_2$ 能互相表出，则称 $I_1,I_2$ 等价。显然这个关系满足自反性，传递性，对称性。

性质：一个向量组和它的任意极大无关组等价

性质：若 $I_1$ 能表出 $I_2$ 且 $|I_1|<|I_2|$ ，则 $I_2$ 线性相关（逆否：若 $I_1$ 能表出 $I_2$ 且 $I_2$ 线性无关，则 $|I_1|\geq |I_2|$ ）

性质：一个向量组的所有极大无关组包含的向量数目都是相等的。

向量组的秩

一个向量组的极大无关组包含的向量数目称为该向量组的秩。特例： $r(0,0,\dots,0)=0$ 。

若两个向量组等价，则它们的秩相等。

性质：若 $I_1$ 能表出 $I_2$ ，则 $rank(I_1)\le rank(I_2)$ 。

矩阵的秩

设 $A=(\alpha_1,\dots,\alpha_m)$ ，则 $\alpha_1,\dots,\alpha_m$ 的秩即为 $A$ 的列秩，其中 $A\in F^{n×m}$ ，同理可以定义行秩。

性质：行秩等于列秩。因为初等变换不会改变行秩列秩，消成最简阶梯型后又易得行秩=列秩。

所以我们将行秩列秩统称为矩阵的秩。

满秩： $r(A_{m,n})=\min(m,n)$ 。若 $m=n$ ，则称为满秩方阵。

我们可以通过化成最简阶梯型找到极大无关组。

向量组生成的子空间

对向量组 $\alpha_1,\dots,\alpha_s\in F^n$ ， $\{k_1\alpha_1+\dots+k_s\alpha_s|k_1,k_2,\dots,k_s\in F\}\subseteq F^n$ 满足数乘，加法封闭，它是 $F^n$ 的子空间。

我们将其称为该向量组生成的子空间，记作 $L(\alpha_1,\dots,\alpha_s)$ 性质：它的极大无关组生成的子空间是相同的。

子空间的基

设 $U$ 是 $K^n$ 的一个子空间，若向量组 $I=(\alpha_1,\alpha_2,\dots,\alpha_r)$ 满足以下条件：

$I$ 线性无关
$U$ 中每一个向量都能由 $I$ 表出

则 $I$ 是 $U$ 的一个基。

性质：任意两个基都是等价的，我们把一个向量空间的基的大小记为 $\dim_F U$ .

$\forall \beta\in U$ ，可以把 $\beta$ 表示成 $k_1\alpha_1+\dots+k_r\alpha_r$ ，且表示方式唯一。

称 $(k_1,\dots,k_r)$ 为 $\beta$ 在基 $\alpha_1,\dots,\alpha_r$ 下的坐标。

性质： $U=L(\alpha_1,\dots,\alpha_r)$ 。显然 $\dim L(\alpha_1,\dots,\alpha_r)=rank(\alpha_1,\dots,\alpha_r)$

性质： $d$ 维空间中大小 $>d$ 的向量组必相关

性质： $d$ 维空间中任意 $d$ 个无关的向量都构成一组基

性质：若 $U\subseteq V$ 且 $\dim U=\dim V$ ，则 $U=V$

方程解空间

现在我们来分析一下齐次方程 $Ax=0$ 的解空间 $U$ ，令 $A\in F^{m×n},x\in F^n$ 。定理： $dim_U=n-r(A)$

原因是你发现把 $A$ 消元之后自由变量的个数就是 $n-r(A)$ ，它们的任意一个取法就对应了 $U$ 中的一个元素。

写出齐次方程的解空间：求出通解，找到 $n-r$ 个基（取一个自由变量为 $1$ ，其他自由变量为 $0$ ），从而确定基

非齐次方程怎么分析呢？

对于非齐次方程 $\alpha_1x_1+\alpha_2x_2+\dots+\alpha_nx_n=\beta$ ，考虑 $\alpha$ 构成的矩阵 $A$ 和增广矩阵 $A'$ 。

性质：有解 $\leftrightarrow$ $r(A)=r(A')$ 。

定理：该方程的解集是 $r_0+U$ ，其中 $r_0$ 为任一特解， $U$ 是 $\beta=0$ 时的解空间。

行列式

首先我们阐释一下映射中的像和原像：对于 $f:A\to B$ ， $S\subseteq A$ ，称 $S$ 的像是 $f(S)$ ，即 $\{f(x)|x\in S\}$

对于 $T\subseteq B$ ，称 $T$ 的原像是 $f^{-1}(T)$ ，即 $\{x|f(x)\in T\}$

定义线性函数 $f:F^n\to F$ 满足 $f(k\alpha+l\beta)=kf(\alpha)+lf(\beta)$

然后我们称 $f:F^n×F^n\dots×F^n\to F$ （ $k$ 个 $F^n$ ）为 $F^n$ 上的 $k$ 重线性函数，若固定其他 $k-1$ 个向量，剩下的 $F^n\to F$ 是线性的。

$k=1$ 时即线性函数， $k=2$ 时称为双线性函数。

例：设 $f_{i,j}(\alpha,\beta)=\alpha_i\beta_j$ ，那么 $f_{i,j}$ 是双线性函数。

我们记 $L^k(F^n)$ 为 $F^n$ 上的 $k$ 重线性函数集，这个集合关于函数 $+,\cdot$ 构成了向量空间，且 $f_{i_1,i_2,\dots,i_k}$ 这 $n^k$ 个函数是它的一组基，

因为能发现 $f(\alpha_1,\dots,\alpha_k)=\sum\limits_{i_1,i_2,\dots,i_k\le n}f(\epsilon_{i_1},\epsilon_{i_2},\dots,\epsilon_{i_k})\prod\limits_{j=1}^k\alpha_{j,i_j}$ ，这个性质后面有用。

反对称： $f\in L^k(F^n)$ 满足若 $\alpha_i=\alpha_j(i\neq j)$ ，则 $f(\alpha_1\dots\alpha_i\dots\alpha_j\dots\alpha_k)=0$

其实这等价于 $f(\alpha_1\dots\alpha_i\dots\alpha_j\dots\alpha_k)+f(\alpha_1\dots\alpha_j\dots\alpha_i\dots\alpha_k)=0$

怎么证明呢？先证条件 $1$ $\to$ 条件 $2$ 。考察 $f(\dots \alpha_i+\alpha_j\dots\alpha_i+\alpha_j\dots)=f(\dots\alpha_j\dots\alpha_i\dots)+f(\dots\alpha_i\dots\alpha_j\dots)+f(\dots\alpha_i\dots\alpha_i\dots)+f(\dots\alpha_j\dots\alpha_j\dots)$

把等于 $0$ 的部分代入即可。条件 $2$ $\to$ 条件 $1$ 是容易的。

定义 $D:M_n(F)\to F$ 为 $F^n$ 上的 $n$ 阶行列式函数，当且仅当：它是 n-重线性函数，它反对称，且 $D(E_n)=1$

显然 $D$ 是唯一确定的，但我们尝试严谨的说明这个事情。

设 $M_{ij}$ 是去掉 $a_{i,j}$ 所在的行和列之后构成的 $n-1$ 阶方阵，称 $A_{ij}=(-1)^{i+j}D_{n-1}(M_{ij})$ 为 $a_{ij}$ 的代数余子式。

接下来归纳构造行列式函数，任取 $1\le j\le n$ ，令 $D_n(A)=\sum\limits_{i=1}^n a_{i,j}A_{i,j}$ 可以证明它确实满足行列式函数的三个条件。

我们换一个方式写出来这个函数。考虑 $f(\alpha_1,\dots,\alpha_n)=\sum\limits_{i_1,i_2,\dots,i_n\le n}f(\epsilon_{i_1},\epsilon_{i_2},\dots,\epsilon_{i_n})\prod\limits_{j=1}^n\alpha_{j,i_j}$ ，而如果 $i_j=i_k$ 则根据反对称 $f(\epsilon_{i_1},\epsilon_{i_2},\dots,\epsilon_{i_n})=0$ 。看来 $\{i_n\}$ 一定是一个排列。而且 $f(\epsilon_{i_1},\epsilon_{i_2},\dots,\epsilon_{i_n})$ 也容易计算出来，因为它可以从 $\{1,2,\dots,n\}$ 开始不断交换相邻项得到，根据反对称性，我们直接看它的逆序数的奇偶性即可。

所以 $f(\alpha_1,\dots,\alpha_n)=\sum\limits_{p\in Sym_n}(-1)^{\tau(p)}\prod\limits_{i=1}^n \alpha_{i,p_i}$ ，其中 $\tau(p)$ 表示逆序对数。

求解行列式

最朴素的方法是用高斯消元消成上三角矩阵。

然后对于一些特殊的行列式，我们可以进行一些手玩以进行消元。

另一个方法是用代数余子式。我们称 $|A|$ 按第 $i$ 行展开为 $|A|=\sum\limits_{j=1}^n a_{i,j}A_{i,j}$ （对于一些特殊的稀疏矩阵很有效）

另一个 trick 是把原矩阵在最后添加一行一列，使得 $\forall i\le n,a_{i,n+1}=0$ ，而 $a_{n+1,n+1}=1$ 。

还有一个事情： $\det(\alpha_1,\dots,\alpha_k+\beta,\dots,\alpha_n)=\det(\alpha_1,\dots,\alpha_k,\dots,\alpha_n)+\det(\alpha_1,\dots,\beta,\dots,\alpha_n)$

Laplace 展开

我们先定义 $k$ 阶子式的代数余子式：

设这个子式下标是 $i_1,i_2,\dots,i_k,j_1,j_2,\dots,j_k$ ，那么它的代数余子式就是 $(-1)^{i_1+i_2+\dots+i_k+j_1+j_2+\dots+j_k}$ 乘以余下的矩阵的行列式。

Laplace 展开（多行/多列展开）：

考虑 $A=(a_{i,j})_n$ 中的 $k$ 个行 $i_1<i_2<\dots<i_k$ ，这 $k$ 个行对应了 $t=\tbinom{n}{k}$ 个 $k$ 阶子式，我们记为 $D_1,D_2,\dots,D_t$ ，对应的代数余子式为 $A_1,A_2,\dots,A_t$ ，则 $|A|=\sum\limits_{i=1}^t D_iA_i$

例：我们可以证明 $\left|\begin{array}{}A&0\\B&C\end{array}\right|=|A|\cdot |C|$ ，其中 $A,C$ 都是方阵。理由就是设 $A$ 的行数为 $n$ ，对前 $n$ 行展开即可。

范德蒙德行列式

设 $D(a_1,a_2,\dots,a_n)$ 是满足 $A_{i,j}=a_i^{j-1}$ 的矩阵的行列式。

考虑以下消元：从第 $n-1$ 列到第 $1$ 列，依次把第 $i$ 行乘上 $-a_1$ 加到第 $i+1$ 行上。那除了 $a_{1,1}$ 第 $1$ 列变成全 $0$ ，而 $\forall i\geq 2,j\geq 2$ ， $a'_{i,j}=a_i^{j}-a_1a_i^{j-1}=a_i^{ ,hj-1}(a_i-a_1)$ 。

于是按第 $1$ 列展开，并对每一行提取公因子 $a_i-a_1$ ，可得 $D(a_1,a_2,\dots,a_n)\prod\limits_{i=2}^n (a_i-a_1)D(a_2,\dots,a_n)$

于是有 $D(a_1,a_2,\dots,a_n)=\prod\limits_{1\le i<j\le n}(a_j-a_i)$ 。

克莱姆法则

考虑方程 $x_1\alpha_1+x_2\alpha_2+\dots+x_n\alpha_n=\beta$ ，矩阵 $A=(\alpha_1,\alpha_2,\dots,\alpha_n)\in F^{n×n}$ ，则方程组有唯一解 $\leftrightarrow \det(A)\neq 0\leftrightarrow rank(A)=n$ ，且这个解为 $x_i=\frac{|A_i|}{|A|}$ ，其中 $A_i=(\alpha_1,\dots,\alpha_{i-1},\beta,\alpha_{i+1},\dots,\alpha_n)$ 。

这个东西是能直接解出来的，考虑 $\det(A_i)=\det(\alpha_1,\dots,\alpha_{i-1},\sum x_j\alpha_j,\alpha_{i+1},\dots,\alpha_n)=\sum\limits_{j}x_j\det(\alpha_1,\dots,\alpha_{i-1},\alpha_{j},\alpha_{i+1},\dots,\alpha_n)=x_i\det(A)$ 。于是 $x_i=\frac{|A_i|}{|A|}$ 。

这里可以再讨论一下行列式和秩的联系。

引理：若 $A$ 有一个 $k$ 阶子式非 $0$ ，则 $rank(A)\geq k$ 。

定理： $r(A)=k\leftrightarrow$ 存在一个非 $0$ 的 $k$ 阶子式且所有 $k+1$ 阶子式皆为 $0$ 。

一个记号： $A\begin{pmatrix}i_1,\dots,i_k\\j_1,\dots,j_k\end{pmatrix}$ 表示 $A$ 的一个 $k$ 阶子式

矩阵运算

加法，数乘，零元，负元，乘法皆显然

还可以对矩阵做分块，比如写成行/列向量的拼接，这样往往方便我们分析乘法的性质。比如说有 $\begin{pmatrix}\alpha_1\\\vdots \\\alpha_n\end{pmatrix}B=\begin{pmatrix}\alpha_1B\\\vdots \\\alpha_nB\end{pmatrix}$ 。

性质： $r(A+B)\le r(A)+r(B),r(AB)\le \min(r(A),r(B))$ 。若 $A_{n*m}B_{m*p}=0$ ，则 $r(A)+r(B)\le m$ 。 $r(A^TA)=r(AA^T)=r(A)$ 。

我们来证为何 $r(AA^T)=r(A)$ ，只需要证 $AA^TX=0$ 和 $AX=0$ 同解。

一个方向显然。另一个方向： $AA^TX=0\to X^TAA^TX=0\to ||A^TX||^2=0\to A^TX=0$

同理还有 $r(AA^TA)=r(A)$

向量 $\alpha_1,\alpha_2,\dots,\alpha_n$ 能表出 $\beta_1,\beta_2,\dots,\beta_m$ 当且仅当存在矩阵 $X_{n*m}$ 使得 $(\alpha_1,\alpha_2,\dots,\alpha_n)X=(\beta_1,\beta_2,\dots,\beta_m)$ 。因为 $\beta_j=\sum\limits_{i} \alpha_i X_{i,j}$ 。

观察：对矩阵的行初等变换全部可以看做左乘了一个方阵，同理列变换是右乘一个方阵。

第一类变换：交换两行第二类变换：一行乘 $k$ 倍第三类变换：一行乘 $k$ 倍加到另一行

只用第三类变换就能把矩阵消成：一个子矩阵是 $r*r$ 的对角矩阵，其余位置全 $0$ 。而且第三类变换不改变矩阵行列式。

这样就能证明 $|A||B|=|AB|$ :

设 $A=x_1x_2\dots x_pDy_1y_2\dots y_q$ 。则 $|AB|=|x_1x_2\dots x_pDy_1y_2\dots y_qB|=|Dy_1y_2\dots y_qB|$ 。注意到对角矩阵乘上 $y_1y_2\dots y_qB$ 其实是在做第二类变换，于是它就等于 $|D|\cdot |y_1y_2\dots y_qB|=|D|\cdot |B|=|A||B|$ 。

现在考虑矩阵的逆 $A^{-1}$ 。我们有 $A$ 可逆当且仅当 $|A|\neq 0$ 。且逆元唯一：如果 $B,C$ 都是 $A$ 的逆，那么 $B=BE=BAC=(BA)C=C$ 。

$A^{-1}$ 怎么计算：考虑伴随矩阵 $A^{*}$ 满足 $A^{*}_{i,j}=A_{j,i}$ ，其中 $A_{i,j}$ 表示代数余子式。则根据行列式的展开/异行展开，可得 $A^{*}A=AA^{*}=|A|I$ ，于是 $A^{-1}=\frac{A^{*}}{|A|}$ 。

更高效的方法：对 $\begin{pmatrix}A&I\end{pmatrix}$ 做行初等变换得到 $\begin{pmatrix}I&B\end{pmatrix}$ ，有 $B=A^{-1}$ ，因为初等变换可以看做乘初等矩阵。

性质： $(AB)^{-1}=B^{-1}A^{-1}$

降阶定理： $|A+BC|=|A|\cdot |I+\cdot CA^{-1}B|$ 这可以通过分块矩阵推导得到

正交

对于某线性子空间 $V\subseteq R^n$ ，我们如此定义正交基：

$V=span(\beta_1,\dots,\beta_s)$ ，且 $\forall i\neq j$ ， $\beta_i\cdot \beta_j=0$ 。

进一步的，如果还满足 $\forall i,\beta_i\cdot \beta_i=1$ ，我们称为标准正交基。

怎么求出一组正交基呢？设 $V=span(\alpha_1,\dots,\alpha_s)$ ，我们可以如此构造：

$\beta_1=\alpha_1,\beta_2=\alpha_2-\frac{\beta_1\cdot \alpha_2}{\beta_1\cdot \beta_1}\beta_1$ ，以此类推， $\beta_s=\alpha_s-\sum\limits_{i=1}^{s-1}\frac{\alpha_s\cdot \beta_i}{\beta_i\cdot \beta_i}\beta_i$ 。

由正交基求标准正交基是 trivial 的。

现在我们定义 正交阵 ：

$Q\in R^{n×n}$ 是正交阵，当且仅当 $Q^TQ=I$ 。

你发现如果设 $Q=(\eta_1,\dots,\eta_n)$ ，那 $\eta_1,\dots,\eta_n$ 其实是 $R^n$ 的一组标准正交基。

线性映射

接下来，对于 $V_1,V_2$ 是 $R^n$ 的线性子空间，我们定义线性映射 $f:V_1\to V_2$ 满足： $f(\alpha_1+\alpha_2)=f(\alpha_1)+f(\alpha_2)$ 以及 $f(k\alpha)=kf(\alpha)$ ，也就是说它保加法，保数乘。

线性映射有一些良好性质。若 $f$ 是单射，则 $V_1$ 的无关组映射后还是无关组。若 $f$ 是同构，则 $f$ 将 $V_1$ 的基映射到 $V_2$ 的基。

若存在 $V_1$ 到 $V_2$ 的同构映射，则称 $V_1,V_2$ 同构，记作 $V_1\cong V_2$ 。

可以证明 $V_1\cong V_2\Leftrightarrow \dim V_1=\dim V_2$

现在我们定义线性映射的核和像。定义 $\ker f=\{\alpha\in V_1|f(\alpha)=0\}\subseteq V_1$ 定义 $\text{Im} f=\{f(\alpha)|\alpha\in V_1\}\subseteq V_2$

ker 和 Im 有良好的性质。考虑 $m*n$ 的矩阵以及 $f:F^n\to F^m$ 满足 $f(X)=AX$ ，我们有 $\dim \ker f=n-r(A),\dim \text{Im} f=r(A)$ 。

这让我想起期中考试的最后一题：证明 $\dim \{BX|ABX=0\}=r(B)-r(AB)$ 。其实很简单，设 $V_1=\{BX\}$ ，设 $f:V_1\to F^n$ 满足 $f(P)=AP$ ，那么 $\dim \{BX|ABX=0\}=\ker f=\dim V_1-\text{Im} f=r(B)-r(AB)$ 。

我们可以观察线性映射的整体结构。对于线性空间 $V_1,V_2$ ，考察 $V_1,V_2$ 间的所有线性映射，即 $\text{Hom}_F(V_1,V_2)$ 。发现每个线性映射都可以用一个矩阵表示，因为我们能取出 $V_1$ 的基，确定 $f(\alpha_1),\dots,f(\alpha_n)$ 即可。所以我们称其矩阵表示为 $(f(\alpha_1),\dots,f(\alpha_n))=(\beta_1,\dots,\beta_m)A_{m×n}$ 。这让我们感受到研究线性映射其实就是研究矩阵。

我们可以在 $Hom_F(V,V)$ 定义加法和乘法，和矩阵的加法乘法类似。有 $(f+g)(x)=f(x)+g(x),(fg)(x)=f(g(x))$ 。

接下来我们可以观察同一线性映射的不同表示间的关系：

考虑 $Hom_F(V_1,V_2)$ 的某映射 $f$ ，设 $V_1$ 的两组基是 $(\alpha_1,\dots,\alpha_m),(\alpha'_1,\dots,\alpha'_m)$ ， $V_2$ 的两组基是 $(\beta_1,\dots,\beta_n),(\beta'_1,\dots,\beta'_n)$ 。

我们设 $(f(\alpha_1),\dots,f(\alpha_m))=(\beta_1,\dots,\beta_n)A,(f(\alpha'_1),\dots,f(\alpha'_m))=(\beta'_1,\dots,\beta'_n)B,(\alpha'_1,\dots,\alpha'_m)=(\alpha_1,\dots,\alpha_m)S,(\beta'_1,\dots,\beta'_n)=(\beta_1,\dots,\beta_n)T$ 。我们有 $TB=AS$ ，于是 $T^{-1}AS=B$ 。

反之，对任意可逆矩阵 $T,S$ ，若 $A$ 是 $f$ 的某个矩阵表示，那 $B=TAS$ 也是 $f$ 的某个矩阵表示。

同理，考虑 $Hom_F(V,V)$ 中的某映射 $f$ ，设 $V$ 的两组基是 $(\alpha_1,\dots,\alpha_m)$ 和 $(\beta_1,\dots,\beta_m)$ 。令 $(f(\alpha_1),\dots,f(\alpha_m))=(\alpha_1,\dots,\alpha_m)A,(f(\beta_1),\dots,f(\beta_m))=(\beta_1,\dots,\beta_m)B,(\beta_1,\dots,\beta_m)=(\alpha_1,\dots,\alpha_m)U$ ，我们有 $U^{-1}AU=B$ 。

反之，对线性映射 $f$ 和某矩阵表示 $A$ 和可逆矩阵 $T$ ，都有 $B=T^{-1}AT$ 亦为 $f$ 在某矩阵表示。

上面的事情启发了我们什么呢？

相抵和相似

相抵

在 $M_{m×n}(F)$ 上，我们定义等价关系 $\sim$ 满足 $A\sim B\Leftrightarrow $ $A$ 能通过初等变换得到 $B$ ，也就是存在可逆矩阵 $S,T$ 使得 $SAT=B$ 。你发现这相当于 $A\sim B\Leftrightarrow r(A)=r(B)$ 。这被称为 $A,B$ 相抵。

通过之前的分析我们知道：同一线性映射的不同表示是某个等价类。所以对任一线性映射 $f:V_1\to V_2$ ，我们都能找到 $V_1$ 的一组基 $(\alpha_1,\dots,\alpha_m)$ , $V_2$ 的一组基 $\beta_1,\dots,\beta_n$ ，使得 $(f(\alpha_1),\dots,f(\alpha_m))=(\beta_1,\dots,\beta_n)\begin{pmatrix}E_r&0\\0&0\end{pmatrix}$ 。

趣题：证明任一矩阵 $A_{m×n}$ 都能拆成一个列满秩矩阵和行满秩矩阵的乘积。

设其秩为 $r$ ，有 $A=S\begin{pmatrix}E_r&0\\0&0\end{pmatrix}T=S\begin{pmatrix}E_r\\0\end{pmatrix}\begin{pmatrix}E_r&0\end{pmatrix}T$ ，其中 $S,T$ 是可逆矩阵。那么 $S\begin{pmatrix}E_r\\0\end{pmatrix}$ 列满秩， $\begin{pmatrix}E_r&0\end{pmatrix}T$ 行满秩。

相似

我们再在 $M_{n*n}(F)$ 上定义等价关系： $A\sim B\Leftrightarrow \exists$ 可逆阵 $U$ 使得 $U^{-1}AU=B$ 。我们称这样的 $A,B$ 是相似的。

相似有更多良好的性质。

首先它也是等价关系。其次，如果 $A\sim B$ ，那么 $det(A)=det(B)$ ， $tr(A)=tr(B)$ 。注：对于任意矩阵 $A,B$ ，都有 $tr(AB)=tr(BA)$ 。

接下来，类似于相抵关系下的标准形，我们希望找到相似关系的标准形，那其实就是希望找到 $U$ 使得 $D=U^{-1}AU$ 是对角阵。如果能找到这样的 $U$ ，就称 $A$ 可对角化， $D$ 是 $A$ 的相似标准形。

经过一些计算，发现其实就是要找到线性无关的 $n$ 个向量 $\alpha_1,\dots,\alpha_n$ ，使得 $A\alpha_i=\lambda_i\alpha_i$ 。

这启发我们研究 $A\alpha=\lambda_0\alpha$ 的性质。我们称 $\lambda_0$ 是 $A$ 的特征值， $\alpha$ 是 $A$ 的属于特征值 $\lambda_0$ 的一个特征向量。

不难发现 $\lambda_0$ 是特征值 $\Leftrightarrow (A-\lambda_0I)\alpha=0$ 有非零解 $\Leftrightarrow$ $\det(A-\lambda_0I)=0$ 。

这引出了 特征多项式 ：设 $f(\lambda)=|\lambda I-A|$ ，那么特征值就是这个函数的所有零点。我们把 $\ker (\lambda_i I-A)$ 称为 $A$ 的属于 $\lambda_i$ 的特征子空间 ，记为 $V_i$ 。

然后可以证明：若 $\lambda_i\neq \lambda_j$ ，则 $V_i\cap V_j=\{0\}$ 。

于是 $A_n$ 可对角化 $\Leftrightarrow$ $\sum\limits_{i=1}^r \dim V_i=n$

我们设 $f(\lambda)=|\lambda E-A|=\prod\limits_{i=1}^r (\lambda-\lambda_i)^{\alpha_i}$ 。

称 $\alpha_i$ 是 $\lambda_i$ 的代数重数， $\dim V_i$ 是几何重数。可以证明几何重数 $\le$ 代数重数。

特征值的函数保持性 设 $\lambda_0$ 为 $A$ 的特征值， $\alpha$ 是对应特征向量，有 $g(\lambda_0)$ 是 $g(A)$ 的特征向量，且 $\alpha$ 是 $g(A)$ 的属于 $g(\lambda_0)$ 的特征向量。证明很简单：可以归纳证明 $A^k\alpha=\lambda_0^k\alpha$ 。

可以导出：如果非零矩阵 $A$ 满足 $A^k=0$ ，那么 $A$ 不可对角化。因为 $A^k=0\to \lambda^k=0\to \lambda=0$ ，特征值只有 $0$ 且可对角化，就只能导出 $0$ 了。

例题：若 $A=A^2$ ，则 $A$ 必能对角化。因为 $A$ 特征值满足 $\lambda=\lambda^2$ ，于是特征值只有 $0,1$ 。往证： $\dim \ker A+\dim \ker (A-I)=n$ 。这是经典题

实对称矩阵对角化

命题 1：实对称矩阵的特征多项式在复数域下每一个根都是实数。

命题 2：实对称矩阵属于不同特征值的特征向量是正交的。

命题 3：实对称矩阵一定正交对称于某个单位矩阵。