马修·伯恩斯坦讲线性代数系列：矩阵作为函数

线性代数的核心思想是将矩阵表示函数。在本文中，我们将考察几个常见的初等函数，并讨论它们对应的矩阵。

引言¶

回想一下，矩阵-向量乘法的定义使我们能够从以下意义上将矩阵视为函数：如果我们固定一个矩阵 \(\boldsymbol{A} \in \mathbb{R}^{m \times n}\)，该矩阵将 \(\mathbb{R}^n\) 中的向量映射到 \(\mathbb{R}^m\) 中的向量。也就是说，我们可以定义一个函数 \(T : \mathbb{R}^n \rightarrow \mathbb{R}^m\)：

\[ T(\boldsymbol{x}) := \boldsymbol{A}\boldsymbol{x} \]

在本文中，我们将考察几个常见的初等函数，并讨论它们对应的矩阵。

单位矩阵定义了单位函数¶

回想一下，对于一个集合 \(S\)，单位函数 \(f\) 是对于所有 \(x \in S\) 都满足 \(f(x) := x\) 的函数。在向量空间 \(\mathbb{R}^n\) 上的一个函数 \(T\) 的语境中，单位函数 \(T(\boldsymbol{x}) := \boldsymbol{x}\) 对所有 \(\boldsymbol{x} \in \mathbb{R}^n\) 都成立，该函数使用 \(\mathbb{R}^n\) 的单位矩阵来定义。记为 \(\boldsymbol{I}_n\)（如果上下文中已暗示维数，则简写为 \(\boldsymbol{I})\)，它是一个只有对角线上是 1 而其他位置是 0 的方阵。

定义 1 (单位矩阵)： 每个实值欧几里得向量空间 \(\mathbb{R}^n\) 关联着一个单位矩阵，记为 \(\boldsymbol{I}_{n \times n}\)（如果上下文中已暗示维数，则简写为\(\boldsymbol{I}\)），这是一个方阵，除了对角线上的元素为 1 外，其余元素均为 0。

注意

恒等函数(Identity Function)和单位函数(Unit Function / Identity Function)在大多数情况下指代的是同一个概念—— \(f(x) = x\) 的函数。前者强调“输入与输出相等”的属性，后者则强调其作为“单位元”在运算中的作用。它们都是指那个“什么都不做，保持原样”的函数。

例如，\(\mathbb{R}^3\) 的单位矩阵定义为

\[\boldsymbol{I}_3 := \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}\]

可以很容易证明，使用单位矩阵 \(\boldsymbol{I}_n\) 与任意向量 \(\boldsymbol{x} \in \mathbb{R}^n\) 进行[[矩阵-向量乘法]]将得到相同的向量 \(\boldsymbol{x}\)。因此，函数 \(T(\boldsymbol{x}) := \boldsymbol{I}\boldsymbol{x}\) 是定义域为 \(\mathbb{R}^n\) 的单位函数。下图示意性地描绘了这一点：

零矩阵定义了零函数¶

回想一下，对于一个集合 \(S\)，零函数 \(f\) 是所有 \(x \in S\) 都满足 \(f(x) := 0\) 的函数。在向量空间 \(\mathbb{R}^n\) 上的函数 \(T\) 的语境中，零函数 \(T(\boldsymbol{x}) := \boldsymbol{0}\) 对所有 \(\boldsymbol{x} \in \mathbb{R}^n\) 都成立，该函数使用 \(\mathbb{R}^n\) 的零矩阵来定义，记为 \(\boldsymbol{0}_n\)，它是一个所有元素全为 0 的方阵。

定义 2 (零矩阵)： 每个实值欧几里得向量空间 \(\mathbb{R}^n\) 关联着一个零矩阵，记为 \(\boldsymbol{0}_{n \times n}\)，这是一个所有元素均为 0 的方阵。

例如，\(\mathbb{R}^3\) 的零矩阵定义为

\[\boldsymbol{0}_3 := \begin{bmatrix} 0 & 0 & 0\\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}\]

可以很容易证明，使用零矩阵 \(\boldsymbol{0}_n\) 与任意向量 \(\boldsymbol{x} \in \mathbb{R}^n\) 进行矩阵-向量乘法将得到零向量 \(\boldsymbol{0}\)。因此，函数 \(T(\boldsymbol{x}) := \boldsymbol{0}_n\boldsymbol{x}\) 是定义域为 \(\mathbb{R}^n\) 的零函数。下图示意性地描绘了这一点：

逆矩阵定义了逆函数¶

假设我们有一个函数 \(T(\boldsymbol{x}) := \boldsymbol{Ax}\)。假设存在一个矩阵 \(\boldsymbol{C}\)，使得函数 \(F(\boldsymbol{x}) := \boldsymbol{Cx}\) 是 \(T\) 的逆函数。也就是说，\(F = T^{-1}\)，其中

\[T^{-1}(T(\boldsymbol{x})) = \boldsymbol{x}\]

如果是这样，那么我们称 \(\boldsymbol{C}\) 为 \(\boldsymbol{A}\) 的逆矩阵。通常，我们将这个逆矩阵 \(\boldsymbol{C}\) 记为 \(\boldsymbol{A}^{-1}\)。下图描绘了这一点：

并非每个矩阵都有逆矩阵。具有逆矩阵的矩阵是一个特殊的矩阵类别，称为可逆矩阵，它们具有特殊的性质，我们将在未来的文章中讨论。

马修·伯恩斯坦讲线性代数系列：矩阵作为函数

引言¶

单位矩阵定义了单位函数¶

零矩阵定义了零函数¶

逆矩阵定义了逆函数¶

评论