矩阵基础运算
\begin{de}[矩阵加法定义] \end{de}
设 \(A = (a_{ij}), B = (b_{ij})\) 都是数域 K 上 \(s \times n\) 矩阵,令 \(C = (a_{ij} + b_{ij})_{s\times n}\), 则称矩阵 C 是矩阵 A 与 B 的 和, 记作 \(C = A + B\).
\begin{de}[矩阵数量乘法定义] \end{de}
设 \(A = (a_{ij})\) 都是数域 K 上 \(s \times n\) 矩阵, \(k \in K_{}\), 令 \(M = (ka_{ij})_{s×n}\), 则称是矩阵 M 是 k 与矩阵 A 的 数量乘积, 记作 \(M = kA\).
矩阵的加法和数量乘法满足类似于 n 维向量的加法与数量乘法所满足的 8 条运算法则: 设 A, B, C 都是 K 上的 \(s \times n\) 矩阵, \(k, l \in K\), 有
\begin{align*}
&1. A+B=B+A; &2. (A+B)+C=A+(B+C); \\
&3. A+0=0+A; &4. A+(-A)=(-A+0)=A; \\
&5. 1A=A; &6. (kl)A=k(lA); \\
&7. (k+l)A=kA+lA; &8.k(A+B)=kA+kB. \\
\end{align*}
\begin{de}[矩阵乘法定义] \end{de}
设 \(A=(a_{ij})_{s×n}\), \(B=(b_{ij})_{n\times m}\), 令 \(C=(c_{ij})_{s\times m}\), 其中 \[ c_{ij}= a_{i1}b_{1j}+a_{i2}b_{2j}+ \cdots + a_{in}b_{nj} = \sum_{k=1}^na_{ik}b_{kj} \] \(i=1,2,⋯,s; j=1,2,⋯,m\). 则矩阵 C 称为矩阵 A 与矩阵 B 的 乘积, 记作 \(C=AB\).
矩阵乘法有以下性质:
- 只有左边矩阵的列数与右边矩阵的行数相同的两个矩阵才能相乘;
- 乘积矩阵的 \((i,j)\) 元等于左边矩阵的第 i 行与右边矩阵的第 j 列的对应元素乘积之和;
- 乘积矩阵的行数等于左矩阵的行数, 乘积矩阵的列数等于右矩阵的列数.
矩阵的性质: 1). 矩阵的乘法适合 结合律: 设 \(A=(a_{ij})_{s×n}\), \(B=(b_{ij})_{n\times m}\), 令 \(C=(c_{m\times r}_{})_{s\times m}\), 则 \((AB)C = A(BC)\), 但矩阵的乘法不适合交换律. 注意从 \(BA=0\), 不能得到 \(B=0 \, or \, A=0\).
对于矩阵 A, 如果存在一个矩阵 \(B\ne0\) 使得 \(AB=0\), 那么称 A 是一个 左零因子; 如果存在一个矩阵 \(C\ne0\), 使得 \(CA=0\), 那么称 A 是一个 右零因子, 左零因子和右零因子统称为 零因子. 零矩阵是零因子, 称它为 平凡零因子.
2). 矩阵的乘法适合 左分配率 和 右分配率. 即 \[ A(B+C) = AB + AC \]
3). 主对角线上元素都是 1, 其余元素都是 0 的 n 级矩阵称为 n 级 单位矩阵, 记作 \(I_{n}\), 或者简记作 I, 容易直接计算得 \[ I_{s}A_{s\times n}= A_{s \times n}, \qquad A_{s \times n} I_n = A_{s \times n} \] 特别是, 如果 A 是 n 级矩阵, 则 \(IA = AI =A\).
4). 矩阵的乘法与数量乘法满足下述关系式: \(k(AB)=(kA)B=A(kB)\).
主对角线上元素是同一个数 k, 其余元素全为 0 的 n 级矩阵称为 数量矩阵, 可以记作 \(kI\).
矩阵的加法, 数量乘法, 乘法与矩阵的转置的关系如下
- \((A+B)’ = A’ + B’\);
- \((kA)’ = kA’\);
- \((AB)‘=B’A’\).
\begin{equation}
\left(
\begin{split}
& a_{11} \quad & a_{12} \quad & \cdots \quad & a_{1n} \\
& a_{21} \quad & a_{22} \quad & \cdots \quad & a_{2n} \\
& \vdots \quad & \vdots \quad & \quad & \vdots \\
& a_{s1} \quad & a_{s2} \quad & \cdots \quad &a_{sn} \\
\end{split}
\right)
\left(
\begin{split}
& x_1 \\
& x_2 \\
& ⋮ \\
& x_n \\
\end{split}
\right) =
\left(
\begin{split}
& b_1 \\
& b_2 \\
& ⋮ \\
& b_n \\
\end{split}
\right)
\end{equation}
即 \(A \symbf{X} = \symbf{β}\).
相应的齐线性方程组可以简洁地写成 \(A \symbf{X} = \symbf{0}\). 于是列向量 \(\symbf{\eta}\) 是齐次线性方程组的解, 当且仅当 \(A \symbf{\eta} = \symbf{0}\).
如果 A 的列向量组为 \(\symbf{α_1, α_2, ⋯, α_n}\), 那么可以把 A 记作 \(A = (\symbf{α_1, α_2, ⋯, α_n})\).
设 \(A=(a_{ij})_{s×n}\), \(B=(b_{ij})_{n\times m}\), A 的列向量组为 \(\symbf{α_1, α_2, ⋯, α_n}\), 按照矩阵乘法的定义, AB 的 j 列为
\begin{equation*}
\left(
\begin{split}
& a_{11}b_{1j} + a_{12}b_{2j} + \cdots + a_{1n}b_{nj} \\
& a_{21}b_{2j} + a_{22}b_{2j} + \cdots + a_{2n}b_{nj} \\
& ⋮ \\
& a_{s1}b_{1j} + a_{s2}b_{2j} + \cdots + a_{sn}b_{nj} \\
\end{split}
\right)
= b_{1j}\symbf{\alpha_1} + b_{2j}\symbf{\alpha_2} + \cdots + b_{nj}\symbf{\alpha_n}
\end{equation*}
于是
\begin{equation}
\begin{aligned}
AB &= (\symbf{α_1, α_2, ⋯, α_n}) \left(
\begin{split}
& b_{11} \quad & b_{12} \quad & \cdots \quad & b_{1m} \\
& b_{21} \quad & b_{22} \quad & \cdots \quad & b_{2m} \\
& \vdots \quad & \vdots \quad & \quad & \vdots \\
& b_{s1} \quad & b_{s2} \quad & \cdots \quad &b_{nm} \\
\end{split}
\right) \\
&= (b_{11}\symbf{\alpha_1} + b_{21}\symbf{\alpha_2} + \cdots + b_{n1}\symbf{\alpha_n}, ⋯, b_{1m}\symbf{\alpha_1} + b_{2m}\symbf{\alpha_2} + \cdots + b_{nm}\symbf{\alpha_n})
\end{aligned}
\end{equation}
由上式可以才看出, A 乘以 B 可以把 A 的列向量组与 B 的每一列对应元素的乘积之和作为 AB 的相应的列向量, 这是矩阵乘法的第二种表述方式.
类似, 设矩阵 B 的行向量组为 \(\symbf{γ_1,γ_2,⋯,γ_n}\), 则
\begin{equation}
AB &= \left(
\begin{split}
& a_{11} \quad & a_{12} \quad & \cdots \quad & a_{1n} \\
& a_{21} \quad & a_{22} \quad & \cdots \quad & a_{2n} \\
& \vdots \quad & \vdots \quad & \quad & \vdots \\
& a_{s1} \quad & a_{s2} \quad & \cdots \quad &a_{sn} \\
\end{split}
\right)
\left(
\begin{split}
& \symbf{γ_1} \\
& \symbf{γ_2} \\
& ⋮ \\
& \symbf{γ_n} \\
\end{split}
\right)
= \left(
\begin{split}
&a_{11}\symbf{γ_1} + a_{12}_{}\symbf{γ_2} + \cdots + &a_{1n}\symbf{γ_n} \\
&a_{21}\symbf{γ_1} + a_{22}_{}\symbf{γ_2} + \cdots + &a_{2n}\symbf{γ_n} \\
&⋮ &⋮ \\
&a_{s1}\symbf{γ_1} + a_{s2}_{}\symbf{γ_2} + \cdots + &a_{sn}\symbf{γ_n}
\end{split}
\right)
\end{equation}
由上式可以才看出, A 乘以 B 可以把 A 的每一行元素与 B 的行向量组的对应向量乘积之和作为 AB 的相应行向量, 这是矩阵乘法的第三种表述方式.
特殊矩阵
对角矩阵
\begin{de}[对角矩阵定义] \end{de}
主对角线以外的元素全为 0 的方阵称为 对角矩阵, 间记作 \(diag\{d_1, d_2, ⋯, d_n\}\).
\begin{mingti}[对角矩阵命题] \end{mingti}
用一个对角矩阵左(右)乘一个矩阵 \(\symbf{A}\), 相当于用对角矩阵的主对角元分别去乘 \(\symbf{A}\) 相应的行(列).
两个对角矩阵的乘积还是 n 级对角矩阵, 并且把相应对角元素相乘.
基本矩阵
\begin{de}[基本矩阵定义] \end{de}
只有一个元素是 1, 其余元素全为 0 的矩阵称为 基本矩阵, \((i,j)\) 元为 1 的矩阵记作 \(E_{ij}\).
\begin{mingti}[基本矩阵命题] \end{mingti}
用 \(E_{ij}\) 左乘一个矩阵 A, 就相当于把 A 的第 j 行搬到第 i 行的位置, 而乘积矩阵的其余行全为零; 用 \(E_{ij}\) 右乘一个矩阵 A, 相当于把 A 的第 i 列搬到第 j 列的位置.
上(下)三角矩阵
\begin{de}[上(下)三角矩阵定义] \end{de}
主对角线下(上)方的元素全为 0 的方阵称为上(下)三角矩阵.
\begin{mingti}[三角矩阵命题] \end{mingti}
两个 n 级上三角矩阵 A 和 B 的乘积仍为上三角矩阵, 并且 AB 的主对角元等于 A 与 B 的相应主对角元的乘积.
初等矩阵
\begin{de}[初等矩阵定义] \end{de}
由单位矩阵经过一次初等行(列)变换得到的矩阵称为 初等矩阵.
\begin{thm}[初等矩阵定理] \end{thm}
用初等矩阵左(右)乘一个矩阵 A, 就相当于 A 作了一次初等行(列)变换.
对称矩阵
\begin{de}[对称矩阵定义] \end{de}
一个矩阵如果满足 \(A = A’\), 那么称 A 是 对称矩阵.
\begin{mingti}[对称矩阵命题-1] \end{mingti}
设 A, B 都是 n 级对称矩阵, 则 \(A+B, kA (k \in K)\) 都是对称矩阵.
\begin{mingti}[对称矩阵命题-2] \end{mingti}
设 A, B 都是 n 级对称矩阵, 则 AB 是对称矩阵的充分必要条件是 A 与 B 可以交换.
斜对称矩阵
\begin{de}[斜对称矩阵定义] \end{de}
一个矩阵如果满足 \(A = -A’\), 那么称 A 是 斜对称矩阵.
\begin{mingti}[斜对称矩阵命题] \end{mingti}
数域 K 上的奇数级斜对称矩阵的行列式等于 0.
矩阵乘积的秩与行列式
\begin{thm}[矩阵乘积秩定理] \end{thm}
设 \(A=(a_{ij})_{s \times n}, B=(b_{ij})_{n \times m}\), 则 \[ rank(AB) ⩽ min\{rank(A) + rank(B)\}.\]
\begin{thm}[矩阵乘积行列式定理] \end{thm}
设 \(A=(a_{ij})_{n \times n}, B=(b_{ij})_{n \times n}\), 则 \[|AB| = |A||B|\]. 可以推广到 n 级矩阵相乘的情形,
\begin{thm}[Binet-Cauchy 公式] \end{thm}
设 \(A=(a_{ij})_{s \times n}, B=(b_{ij})_{n \times s}\), (1) 如果 \(s > n\), 那么 \(|AB|=0\); (2) 如果 \(s \le n\), 那么 |AB| 等于 A 的所有 s 阶子式与 B 的 s 阶子式的乘积之和.
可逆矩阵
\begin{de}[可逆矩阵定义] \end{de}
对于数域 K 上的矩阵 A, 如果存在数域 K 上的矩阵 B, 使得
\begin{equation} AB = BA = I \end{equation}
那么称 A 是 可逆矩阵(或非奇异矩阵).
可逆矩阵一定是方阵, 并且逆矩阵是唯一的.
\begin{de}[逆矩阵定义] \end{de}
如果 A 是可逆矩阵, 那么适合 (1) 的矩阵 B 称为 A 的 逆矩阵, 记作 \(A^{-1}\).
如果 A 是可逆矩阵, 那么 \(AA^{-1}=A^{-1}A=I\), 于是 \(A^{-1}\) 也是可逆矩阵, 并且 \((A^{-1})^{-1}=A\), 可以看出 n 级矩阵 A 可逆的必要条件是 \[|A| ≠ 0.\]
令
\begin{equation*}
A^* = \left\{
\begin{split}
& A_{11} \quad & A_{21} \quad & \cdots \quad & A_{n1} \\
& A_{12}_{} \quad & A_{22} \quad & \cdots \quad & A_{n2} \\
& \vdots \quad & \vdots \quad & \quad & \vdots \\
& A_{1n} \quad & A_{2n} \quad & \cdots \quad &A_{nn} \\
\end{split}
\right\}
\end{equation*}
称 \(A^*\) 是 A 的 伴随矩阵. 有
\begin{equation*}
\left\{
\begin{split}
& a_{11} \quad & a_{12} \quad & \cdots \quad & a_{1n} \\
& a_{21} \quad & a_{22} \quad & \cdots \quad & a_{2n} \\
& \vdots \quad & \vdots \quad & \quad & \vdots \\
& a_{n1} \quad & a_{n2} \quad & \cdots \quad &a_{nn} \\
\end{split}
\right\}
\left\{
\begin{split}
& A_{11} \quad & A_{21} \quad & \cdots \quad & A_{n1} \\
& A_{12}_{} \quad & A_{22} \quad & \cdots \quad & A_{n2} \\
& \vdots \quad & \vdots \quad & \quad & \vdots \\
& A_{1n} \quad & A_{2n} \quad & \cdots \quad &A_{nn} \\
\end{split}
\right\} \ \left\{
\begin{split}
& |A| \quad & 0 \quad & \cdots \quad & 0_{} \\
& 0_{} \quad & |A| \quad & \cdots \quad & 0_{} \\
& \vdots \quad & \vdots \quad & \quad & \vdots \\
& 0_{} \quad & 0_{} \quad & \cdots \quad &|A| \\
\end{split}
\right\} = |A|I
\end{equation*}
即 \[AA^*=I.\] 同理可得 \[A^*A=I.\]
\begin{thm}[可逆矩阵定理] \end{thm}
数域 K 上的 n 级矩阵 A 可逆的充分必要条件是 \(|A| \neq 0\). 当 A 可逆时,
\begin{equation} A^{-1} = \frac{1}{|A|}A^* \end{equation}
数域 K 上的 n 级矩阵 A 可逆还可以推出一些充分必要条件:
数域 K 上的 n 级矩阵 A 可逆
\(⟺\) A 为满秩矩阵
\(⟺\) A 的行(列)向量组线性无关
\(⟺\) A 的行(列)向量组为 \(K^n\) 的一个基
\(⟺\) A 的行(列)空间等于 \(K^n\)
\begin{mingti}[可逆矩阵命题] \end{mingti}
设 A 与 B 都是数域 K 上的 n 级矩阵, 如果 \(AB=I\), 那么 A 与 B 都是可逆矩阵, 并且 \(A^{-1}=B, B^{-1}=A\).
\begin{proposition}[可逆矩阵性质-1] \end{proposition}
单位矩阵 I 可逆, 并且 \(I^{-1} =I\)
\begin{proposition}[可逆矩阵性质-2] \end{proposition}
如果 A 可逆, 那么 \(A^{-1}^{}\) 也可逆, 且 \((A^{-1})^{-1}=A\)
\begin{proposition}[可逆矩阵性质-3] \end{proposition}
如果 n 级矩阵 A, B 都可逆, 那么 AB 也可逆, 并且 \((AB)^{-1}=B^{-1}A^{-1}\).
\begin{proposition}[可逆矩阵性质-4] \end{proposition}
如果 A 可逆, 那么 \(A’\) 也可逆, 并且 \((A’)^{-1}=(A^{-1})’\).
\begin{proposition}[可逆矩阵性质-5] \end{proposition}
可逆矩阵经过初等行变换化成的简化阶梯型矩阵一定是单位矩阵.
\begin{proposition}[可逆矩阵性质-6] \end{proposition}
矩阵 A 可逆的充分必要条件是它可以表示成一些初等矩阵的乘积.
\begin{proposition}[可逆矩阵性质-7] \end{proposition}
用一个可逆矩阵左(右)乘一个矩阵 A, 不改变矩阵的秩.
设 A 是 n 级可逆矩阵, 则存在初等矩阵 \(P_1, P_2, ⋯, P_t\), 使得 \(P_t \cdots P_2 P_1 = I\), 根据 1 可以得到 \(P_t \cdots \P_2 P_1 I = A^{-1}\), 可以得出 \[A ⟶ I, I ⟶ A^{-1}\] 于是有 \[(A, I) = (I, A^{-1}),\] 这给出了求逆矩阵的另一种方法, 称它为 初等行变化法.
设矩阵 A 可逆, 解矩阵方程 \(AX=B\) 时, 可以在两边左乘 \(A^{-1}\), 得到 \(A^{-1}AB=A^{-1}B\), 由此得出 \(X=A^{-1}B\).
设矩阵 A 可逆, 解矩阵方程 \(XA=C\) 时, 可以在两边右乘 \(A^{-1}\), 得到 \(XA^{-1}A=CA^{-1}\), 由此得出 \(X=CA^{-1}\).
矩阵的分块
由矩阵 A 的若干行, 若干列的交叉位置的元素按原来的顺序排成的矩阵称为 A 的一个 子矩阵.
把一个矩阵 A 的行分成若干组, 列也分成若干组, 从而 A 被分成若干个子矩阵, 把 A 看成是由这些子矩阵组成的, 这称为 矩阵的分块, 这种由子矩阵组成的矩阵称为 分块矩阵.
\begin{mingti}[分块矩阵命题-1] \end{mingti}
设 A 是 \(s \times n\) 矩阵, B 是 \(n \times m\) 矩阵, B 的列向量组为 \(\symbf{β_1, β_2, ⋯, \beta_m}\). 则 \[AB = A(\symbf{β_1, β_2, ⋯, \beta_m})=(A\symbf{\beta_1}, A\symbf{β_2}, ⋯, A\symbf{β_m})\].
\begin{cor}[分块矩阵推论-1] \end{cor}
设 \(A_{s \times n} \neq 0, B_{n×m}\) 的列向量组是 \(\symbf{β_1, β_2, ⋯, \beta_m}\). 则 \(AB = 0 \quad ⟺ \quad \symbf{β_1, β_2, ⋯, \beta_m}\) 都是齐次线性方程组 \(AX=0\) 的解.
\begin{cor}[分块矩阵推论-2] \end{cor}
设 \(A_{s \times n} \neq 0, B_{n×m}\) 的列向量组是 \(\symbf{β_1, β_2, ⋯, \beta_m}\); \(C_{s×m}\) 的列向量组是 \(\symbf{δ_1, δ_2, ⋯, δ_m}\). 则 \(AB = C \quad ⟺ \quad \symbf{β_j}\) 是齐次线性方程组 \(A \symbf{X}=\symbf{δ_j}, \, j = 1,2,⋯,m\) 的一个解.
上图中, 进行初等行变换即利用线性方程组的正常解法.
主对角线上的所有子矩阵都是方阵, 而位于主对角线下(上)的所有子矩阵都为 0 的分块矩阵称为 分块上(下)三角矩阵, 容易得到
\begin{mingti}[分块矩阵命题-2] \end{mingti}
设 A, B 分别是 \(s\times n, n×s\) 矩阵, 则 1).
\begin{equation*}
\left|
\begin{split}
I_n \quad & B \\
A \quad & I_s \\
\end{split}
\right| = |I_s - AB|
\end{equation*}
2).
\begin{equation*}
\left|
\begin{split}
I_n \quad & B \\
A \quad & I_s \\
\end{split}
\right| = |I_n - BA|
\end{equation*}
3). \(|I_s - AB| = |I_n| - BA\)
\begin{mingti}[分块矩阵命题-3] \end{mingti}
设
\begin{equation*}
A = \left\{
\begin{split}
A_1 \quad & A_3 \\
0 \quad & A_2 \\
\end{split}
\right\}
\end{equation*}
其中, \(A_1, A_2\) 都是方阵. 则 A 可逆当且仅当 \(A_1, A_2\) 都可逆, 此时
\begin{equation*}
A^{-1} = \left\{
\begin{split}
A_1^{-1} \quad & -A_1^{-1}A_3A_2^{-1} \\
0 \quad & A_2^{-1} \\
\end{split}
\right\}
\end{equation*}
正交矩阵 \(⋅\) 欧几里得空间 \(R^n\)
\begin{de}[正交矩阵定义] \end{de}
实数域上的 n 级矩阵 A 如果满足 \(AA’=I\), 那么称 A 是 正交矩阵.
\begin{mingti}[正交矩阵命题-1] \end{mingti}
实数域上的 n 级矩阵 A 是正交矩阵
\(⟺ \quad AA’ = I\)
\(⟺\) A 可逆, 且 \(A^{-1}=A’\)
\(⟺\) \(A’A=I\)
正交矩阵具有如下性质:
- I 是正交矩阵;
- 如 A 与 B 都是 n 级正交矩阵, 则 AB 也是正交矩阵;
- 若 A 是正交矩阵, 则 \(A^{-1}_{} or A’\) 也是正交矩阵;
- 若 A 是正交矩阵, 则 |A|=1 或 -1.
\begin{mingti}[正交矩阵命题-2] \end{mingti}
设实数域上的 n 级矩阵 A 的行向量为 \(\symbf{γ_1, γ_2, ⋯, γ_n}\); 列向量为 \(\symbf{α_1, α_2, ⋯, α_m}\), 则 1). A 为正交矩正当且仅当 A 的行向量组满足
\begin{equation*}
\symbf{γ_iγ_j’} = \left\{
\begin{split}
&1, \quad if \quad i=j, \\
&0, \quad if \quad i ≠ j.
\end{split}
\right
\end{equation*}
2). A 为正交矩正当且仅当 A 的列向量组满足
\begin{equation*}
\symbf{α_i’α_j} = \left\{
\begin{split}
&1, \quad if \quad i=j, \\
&0, \quad if \quad i ≠ j.
\end{split}
\right
\end{equation*}
\begin{de}[内积定义] \end{de}
在 \(\symbf{R^n}\) 中, 任给 \(\symbf{α}=(a_1, a_2,⋯,a_n), \, \symbf{β}=(b_1,b_2,⋯,b_n)\), 规定
\begin{equation} (\symbf{α,β}) \xlongequal{def} a_1b_1+a_2b_2+⋯+a_nb_n \end{equation}
这个二元函数值 \((\symbf{α,β})\) 称为 \(\symbf{R^n}\) 的一个 内积 (通常称它为 标准内积). (1)也可以写成
\begin{equation} (\symbf{α,β}) = \symbf{αβ’} \end{equation}
根据定义 (1) 可以得到内积有如下性质:
- \((\symbf{α,β}) = (\symbf{β,α})\) (对称性)
- \((\symbf{α+γ,β}) = (\symbf{α+β}) + (\symbf{γ+β})\) (线性之一)
- \((k\symbf{α}\symbf{β}) = k(\symbf{β,α})\) (线性之二)
- \((\symbf{α,α}) ⩾ 0\), 等号成立当且仅当 \(\symbf{α=0}\). (正定性)
如果 \(\symbf{α,β}\) 是列向量, 那么标准内积可写成 \((\symbf{α,β})=\symbf{α’β}\)
n 维向量空间 \(\symbf{R^n}\) 有了标准内积以后, 就称 \(\symbf{R^n}\) 为一个 欧几里得空间.
在欧几里得空间 \(\symbf{R^n}\) 中, 向量 \(\symbf{α}\) 的长度规定为 \[|\symbf{α}| \xlongequal{def} \sqrt{(\symbf{α,α})}\]
长度为 1 的向量称为 单位向量, 显然, \(\symbf{α}\) 为单位向量的充要条件是 \(\symbf{(α, α)}=1\), 对于 \(\symbf{α}≠0\), 有 \(\frac{1}{|\symbf{α}|}\symbf{α}\) 一定是单位向量, 称向量的 \(\symbf{α}\) 单位化.
在欧几里得空间 \(\symbf{R^n}\) 中, 如果 \((\symbf{α, β})=0\), 那么称 \(\symbf{α}\) 与 \(\symbf{β}\) 是 正交 的, 记作 \(\symbf{α} \bot \symbf{β}\), 显然, 零向量与任何向量正交.
在欧几里得空间 \(\symbf{R^n}\) 中, 由非零向量组成的向量组如果其中每两个不同的向量都正交, 那么称它们为 正交向量组, 仅由一个非零向量组成的向量组也是正交向量组, 如果正交向量组的每个向量都是单位向量, 那么称它为 正交单位向量组.
\begin{mingti}[欧几里得空间命题-1] \end{mingti}
在欧几里得空间 \(\symbf{R^n}\) 中, 正交向量组一定是线性无关的.
根据命题(1)可以得到, 在欧几里得空间 \(\symbf{R^n}\) 中, n 个向量组成的正交向量组一定是 \(\symbf{R^n}\) 的一个基, 称它为 正交基, n 个单位向量组成的正交向量组称为 \(\symbf{R^n}\) 的一个 标准正交基, 显然 \(\symbf{ε_1, ε_2, ⋯, ε_n}\) 是 \(\symbf{R^n}\) 的一个 标准正交基.
\begin{mingti}[欧几里得空间命题-2] \end{mingti}
实数域上的 n 级矩阵 A 是正交矩阵的充要条件是: A 的行(列)向量组是欧几里得空间 \(\symbf{R^n}\) 的一个标准正交基.
\begin{thm}[构造标准正交基定理] \end{thm}
设 \(\symbf{α_1,α_2,⋯,α_s}\) 是欧几里得空间 \(\symbf{R^n}\) 中一个线性无关的向量组, 令
\begin{equation}
\begin{split}
\symbf{β_1} \, &= \, \symbf{\alpha_1} \\
\symbf{β_2} \, &= \, \symbf{\alpha_2} - \frac{(\symbf{\alpha_2,\beta_1})}{(\symbf{\beta_1,\beta_1})}\symbf{\beta_1} \\
\cdots \,&= \quad\, \cdots \\
\symbf{β_s} \, &= \, \symbf{\alpha_s} - \sum_{j=1}^{s-1} \frac{(\symbf{\alpha_s,\beta_j})}{(\symbf{\beta_j,\beta_j})}\symbf{\beta_j}
\end{split}
\end{equation}
定理(1)给出了从一个线性无关的向量组 \(\symbf{α_1,α_2,⋯,α_s}\) 构造正交向量组的方法, 称为 施密特(Schmidt)正交化过程, 再将每个正交向量标准化, 即可得到单位正交向量组, 且与 \(\symbf{α_1,α_2,⋯,α_s}\) 等价.
\(K^n\) 到 \(K^s\) 的线性映射
\begin{de}[映射定义] \end{de}
设 S 和 S’ 是两个集合, 如果存在一个对于法则 f, 使得集合 S 中的每一个元素 a, 都有集合 S’ 中唯一确定的元素 b 与它对应, 那么称 f 是 S 到 S’ 的一个 映射, 记作
\begin{equation*}
\begin{split}
f: \, &S ⟶ S’ \\
&a ⟼ b
\end{split}
\end{equation*}
其中, b 称为 a 在 f 下的 象, a 称为 b 在 f 下的 原象. a 在 f 下的象用符号 f(a) 或 fa 表示, 于是映射 f 也可以记成 \[f(a)=b, \, a\in S.\]
设 f 是集合 S 到 S’ 的一个映射, 则把 S 叫做映射 f 的 定义域, 把 S’ 叫做 f 的 陪域, S 的所有元素在 f 下的象组成的集合叫做 f 的 值域 或 f 的 象. 记作 f(S) 或 Imf. 即 \[f(S) \xlongequal{def} \{f(a) | a \in S\}={b \in S’ | ∃ a \in S \, to\, f(a)=b} \], 容易看出 f 的值域是 f 的陪域的子集.
设 f 是集合 S 到集合 S’ 的一个映射, 如果 \(f(S)=S’\), 那么称 f 是 满射, 显然, f 是满射当且仅当 f 的陪域中的每一个元素都有至少一个原象.
如果映射 f 的定义域 S 中不同元素的象也不同, 那么称 f 是 单射 (或 f 是一一对应). 如果映射 f 既是单射也是满射, 那么称 f 是 双射 (或称 f 是 S 到 S’ 的 一一对应), 显然, f 是双射当且仅当陪域中每一个元素都有唯一的原象.
映射 f 与映射 g 相当, 当且仅当它们的定义域相等, 陪域相等, 并且对应法则相同 (\(∀ x \in S, f(x)=g(x)\)), 集合 S 到自身的一个映射, 通常称为 S 上的一个 变换, 集合 S 到数集(数域 K 上的任一非空子集)的一个映射, 通常称为 S 上的一个 函数, 陪域 S’ 中的元素 b 在映射 f 下的所有原象组成的集合称为 b 在 f 下的 原象集, 记作 \(f^{-1}(b)\).
\begin{de}[恒定映射定义] \end{de}
映射 \(f: S ⟶ S\), 如果把 S 中的每一个元素对应到它自身, 即 \(∀x \in S\), 有 \(f(x)=x\), 那么称 f 是 恒等变映射 (或 S 上的 恒等变换), 记作 \(1_S\).
\begin{de}[映射乘积定义] \end{de}
相继施行映射 \(g: S ⟶ S’\) 和 \(f: S’ ⟶ S”\), 得到 S 到 \(S”\) 的一个映射, 称为 f 与 g 的 乘积 (或 合成), 记作 fg, 即 \[(fg)(a) \xlongequal{def} f(g(a)), \quad ∀ a \in S\]
\begin{thm}[映射乘法结合律] \end{thm}
映射乘法适合集合律, 即如果 \(h: S ⟶ S’, \, g: S’ ⟶ S”, \, f: S” ⟶ S”’\), 那么 \(f(gh)=(fg)h\).
\begin{de}[逆映射定义] \end{de}
设 \(f: S ⟶ S’\), 如果存在一个映射, \(g: S’ ⟶ S\), 使得 \[fg = 1_{S’} \quad \quad gf=1_S\] 那么称映射 f 是 可逆 的, 此时称 g 是 f 的一个 逆映射.
\begin{thm}[映射可逆定理] \end{thm}
映射 \(f: S ⟶ S’\) 是可逆的充要条件为 f 是双射.
\begin{de}[线性映射定义] \end{de}
数域 K 上的向量空间 \(K^n\) 到 \(K^s\) 的一个映射 \(σ\) 如果保持加法和数量乘法, 即 \(∀ \symbf{α,β} \in K^n, k \in K\), 有
\begin{equation*}
\begin{split}
σ(\symbf{α+β}) &= σ(\symbf{α})+σ(β) \\
σ(k\symbf{α}) &= kσ(\symbf{α}) \\
\end{split}
\end{equation*}
那么称 σ 是 \(K^n\) 到 \(K^s\) 的一个 线性映射.
设 A 是数域 K 上的 \(s \times n\) 矩阵, 令
\begin{equation}
\begin{split}
\symbf{A}: \, &K^n ⟶ K^s \\
&\symbf{α} ⟼ A\symbf{α}
\end{split}
\end{equation}
容易验证, \(\symbf{A}\) 是 \(K^n\) 到 \(K^s\) 的一个线性映射.
根据定义(1), 可以得出一下几个事实:
\begin{de}[线性映射核定义] \end{de}
设 σ 是 \(K^n\) 到 \(K^s\) 的一个映射, \(K^n\) 的一个子集 \[\{\symbf{α} \in K^n \, | \, σ(\symbf{α})=\symbf{0}\}\] 称为映射 σ 的核, 记作 Ker σ.
容易验证, 如果 σ 是 \(K^n\) 到 \(K^s\) 的一个线性映射, 那么 Ker σ 是 \(K^n\) 的一个子空间. 由(1)定义的线性映射 \(\symbf{A}\), 根据上面事实 3 可以得到 \[Ker \symbf{A} = W\] 即, 由(1)定义的线性映射 \(\symbf{A}\) 的核等于齐次线性方程组 \(A\symbf{X}=\symbf{0}\) 的解空间.
线性映射的象与核之间的关系可以由下式来刻画:
\begin{equation} dim \, Ker \symbf{A} + dim \, Im \symbf{A} = dim \, K^n \end{equation}
例题
逆矩阵的解法
- 根据定义(1), 可以用伴随矩阵去求解
- 根据初等行变换法, 如
- 根据(1), 可以得出解线性方程组的第三种方法
矩阵 QR 分解及最小二乘解
- n 级矩阵 TB 分解
- \(m × n\) 矩阵 QR 分解
- 最小二乘法