跳转至

马修·伯恩斯坦讲线性代数系列:矩阵作为函数

原文:Matrices as functions

线性代数的核心思想是将矩阵表示函数。在本文中,我们将考察几个常见的初等函数,并讨论它们对应的矩阵。

引言

回想一下,矩阵-向量乘法 的定义使我们能够从以下意义上将矩阵视为函数:如果我们固定一个矩阵 \(\boldsymbol{A} \in \mathbb{R}^{m \times n}\),该矩阵将 \(\mathbb{R}^n\) 中的向量映射到 \(\mathbb{R}^m\) 中的向量。也就是说,我们可以定义一个函数 \(T : \mathbb{R}^n \rightarrow \mathbb{R}^m\)

\[ T(\boldsymbol{x}) := \boldsymbol{A}\boldsymbol{x} \]

在本文中,我们将考察几个常见的初等函数,并讨论它们对应的矩阵。

单位矩阵定义了单位函数

回想一下,对于一个集合 \(S\),单位函数 \(f\) 是对于所有 \(x \in S\) 都满足 \(f(x) := x\) 的函数。在向量空间 \(\mathbb{R}^n\) 上的一个函数 \(T\) 的语境中,单位函数 \(T(\boldsymbol{x}) := \boldsymbol{x}\) 对所有 \(\boldsymbol{x} \in \mathbb{R}^n\) 都成立,该函数使用 \(\mathbb{R}^n\) 的单位矩阵来定义。记为 \(\boldsymbol{I}_n\)(如果上下文中已暗示维数,则简写为 \(\boldsymbol{I})\),它是一个只有对角线上是 1 而其他位置是 0 的方阵。

定义 1 (单位矩阵): 每个实值欧几里得向量空间 \(\mathbb{R}^n\) 关联着一个单位矩阵,记为 \(\boldsymbol{I}_{n \times n}\)(如果上下文中已暗示维数,则简写为\(\boldsymbol{I}\)),这是一个方阵,除了对角线上的元素为 1 外,其余元素均为 0。

注意

恒等函数(Identity Function)和单位函数(Unit Function / Identity Function)在大多数情况下指代的是同一个概念—— \(f(x) = x\) 的函数。前者强调“输入与输出相等”的属性,后者则强调其作为“单位元”在运算中的作用。它们都是指那个“什么都不做,保持原样”的函数。

例如,\(\mathbb{R}^3\) 的单位矩阵定义为

\[\boldsymbol{I}_3 := \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}\]

可以很容易证明,使用单位矩阵 \(\boldsymbol{I}_n\) 与任意向量 \(\boldsymbol{x} \in \mathbb{R}^n\) 进行[[矩阵-向量乘法]]将得到相同的向量 \(\boldsymbol{x}\)。因此,函数 \(T(\boldsymbol{x}) := \boldsymbol{I}\boldsymbol{x}\) 是定义域为 \(\mathbb{R}^n\) 的单位函数。下图示意性地描绘了这一点:

零矩阵定义了零函数

回想一下,对于一个集合 \(S\),零函数 \(f\) 是所有 \(x \in S\) 都满足 \(f(x) := 0\) 的函数。在向量空间 \(\mathbb{R}^n\) 上的函数 \(T\) 的语境中,零函数 \(T(\boldsymbol{x}) := \boldsymbol{0}\) 对所有 \(\boldsymbol{x} \in \mathbb{R}^n\) 都成立,该函数使用 \(\mathbb{R}^n\) 的零矩阵来定义,记为 \(\boldsymbol{0}_n\),它是一个所有元素全为 0 的方阵。

定义 2 (零矩阵): 每个实值欧几里得向量空间 \(\mathbb{R}^n\) 关联着一个零矩阵,记为 \(\boldsymbol{0}_{n \times n}\),这是一个所有元素均为 0 的方阵。

例如,\(\mathbb{R}^3\) 的零矩阵定义为

\[\boldsymbol{0}_3 := \begin{bmatrix} 0 & 0 & 0\\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}\]

可以很容易证明,使用零矩阵 \(\boldsymbol{0}_n\) 与任意向量 \(\boldsymbol{x} \in \mathbb{R}^n\) 进行矩阵-向量乘法将得到零向量 \(\boldsymbol{0}\)。因此,函数 \(T(\boldsymbol{x}) := \boldsymbol{0}_n\boldsymbol{x}\) 是定义域为 \(\mathbb{R}^n\) 的零函数。下图示意性地描绘了这一点:

逆矩阵定义了逆函数

假设我们有一个函数 \(T(\boldsymbol{x}) := \boldsymbol{Ax}\)。假设存在一个矩阵 \(\boldsymbol{C}\),使得函数 \(F(\boldsymbol{x}) := \boldsymbol{Cx}\)\(T\) 的逆函数。也就是说,\(F = T^{-1}\),其中

\[T^{-1}(T(\boldsymbol{x})) = \boldsymbol{x}\]

如果是这样,那么我们称 \(\boldsymbol{C}\)\(\boldsymbol{A}\)逆矩阵。通常,我们将这个逆矩阵 \(\boldsymbol{C}\) 记为 \(\boldsymbol{A}^{-1}\)。下图描绘了这一点:

并非每个矩阵都有逆矩阵。具有逆矩阵的矩阵是一个特殊的矩阵类别,称为可逆矩阵,它们具有特殊的性质,我们将在未来的文章中讨论。

评论