解题笔记:一道简单的高等代数综合性题目

看到一道不难但是很有意思的综合性习题. 好吧, 事实上这是 2017 年中山大学研究生入学考试[高等代数]科目的最后一道题. 这道题将数学分析和高等代数的知识结合在一起, 值得一看. 也作为自己对相关知识点的一个小小的复习. 下面就是原题题目.

题目

这里重述一下题目

设 $\mathbf{A}$ 是一个 $n$ 阶实矩阵, 其有 $n$ 个绝对值小于 $1$ 的实特征值, 证明: $$\ln (\det (\mathbf{I}-\mathbf{A}))=-\sum_{k=1}^{\infty}{\frac{1}{k}tr(\mathbf{A}^{k})}.$$ 其中 $\ln$ 为自然对数, $\mathbf{I}$ 表示 $n$ 阶单位矩阵, $\det \mathbf{A}$ 表示 $\mathbf{A}$ 的行列式, $tr (\mathbf{A})$ 表示 $\mathbf{A}$ 的迹.

一些概念

解题前先复习一些概念及相关的性质.

迹 的定义

在线性代数中, 一个 $n\times n$ 的矩阵 $\mathbf{A}$ 的(或迹数), 是指 $\mathbf{A}$ 的主对角线(从左上方至右下方的对角线)上各个元素的总和, 一般记作 $tr(\mathbf {A})$:
$$tr(\mathbf{A} )=\mathbf{A} _{1,1}+\mathbf{A} _{2,2}+\cdots +\mathbf{A} {n,n}$$
其中 $\mathbf{A}
{i, j}$ 代表矩阵的第i行j列上的元素的值. 一个矩阵的迹是其特征值的总和(按代数重数计算).

迹的英文为 trace, 在数学中, 通常简写为 “$tr$”.

迹 的性质

迹是一个线性算子(或者说一个线性函数), 所以具有一般线性算子的所有性质:
$$tr(\mathbf{A} + \mathbf{B}) = tr(\mathbf{A}) + tr(\mathbf{B})$$
$$tr(r \cdot \mathbf{A} ) = r \cdot tr(\mathbf{A})$$

另外, 一个 $n\times n$ 矩阵转置后对角线上的元素不发生变化, 所以有
$$tr(\mathbf{A} ) = tr\left(\mathbf{A}^T \right)$$

同时, 关于矩阵的特征值, 还有以下关系
$$tr( \mathbf{A}) = \lambda_1 + \lambda_2 + \cdots + \lambda_n$$
其中的 $\lambda_1,\lambda_2 \cdots \lambda_n$ 是矩阵的特征值. 而且有:
$$\forall m \in \mathbb{N}, tr( \mathbf{A}^m) = \lambda_1^m + \lambda_2^m + \cdots + \lambda_n^m$$

关于迹的更多内容参考: 迹 - 维基百科, 自由的百科全书

Jordan 标准型

关于 Jordan 标准型的详细内容, 请参考: 若尔当标准型 - 维基百科, 自由的百科全书

这里仅复述几个高等代数中关于若尔当(Jordan)标准型的结果:

对任意系数域为 $\mathbb {K}$ 的矩阵 $\mathbf{A}$, 只要其特征值都在 $\mathbb {K}$ 中, 就存在一个与之相似的若尔当标准型 $\mathbf{J}$:使得 $\mathbf{A=PJP^1}$, 其中 $\mathbf{P}$ 是一个可逆矩阵. 并且满足:

  • 矩阵 $\mathbf{J}$ 的特征值(计入重数)就是主对角线上的系数.
  • 对于 $\mathbf{J}$ 的一个特征值 $\lambda_i$, 它的几何重数就是属于特征值 $\lambda_i$ 的若尔当块的个数.
  • 所有属于特征值 $\lambda_i$ 的若尔当块的维数之和是特征值 $\lambda_i$ 的代数重数.

幂级数

级数理论是数学分析中很重要的一部分基础内容. 幂级数就是函数项级数中的一个常用的例子. 关于函数项级数, 主要研究的有收敛性, 极限(和)函数的连续性、可微性、可积性等内容. 为了保证极限(和)函数能保留通项具有的性质, 便有了一致收敛性.

幂级数在其收敛域上保持连续性、可微性、可积性, 即:

**连续性**:幂级数 $\sum_{n=0}^{\infty}{a_{n}x^{n}}$ 的和函数 $s(x)$在其收敛域 $D$上连续.
**可积性**:幂级数 $\sum_{n=0}^{\infty}{a_{n}x^{n}}$ 的和函数 $s(x)$ 在其收敛域 $D$ 上可积, 且有逐项积分公式: $$\int_{a}^{b}{\sum_{n=0}^{\infty}{a_{n}x^{n}} dx} = \sum_{n=0}^{\infty}{\int_{a}^{b}{a_{n}x^{n} dx}}$$ 且逐项积分后的级数与原级数有相同的收敛半径.
**可微性**:幂级数 $\sum_{n=0}^{\infty}{a_{n}x^{n}}$ 的和函数 $s(x)$在其收敛域 $D$ 上可微, 且有逐项求导公式: $$\left(\sum_{n=0}^{\infty}{a_{n}x^{n}}\right)' = \sum_{n=0}^{\infty}{\left(a_{n}x^{n}\right)'}$$ 且逐项求导后的级数与原级数有相同的收敛半径.

原题的解题过程

看到题目第一眼, 应该考虑到从化简待证式右边入手.

右边
$$\sum_{k=1}^{\infty}{\frac{1}{k}tr(\mathbf{A}^{k})}\quad(eq.1)$$
是一个无穷级数. 我们设矩阵 $\mathbf{A}$ 的 $n$ 个特征值为 $\lambda_1,\lambda_2 \cdots \lambda_n$.

首先, 由迹的性质, 对于每一个 $k$, 有
$$tr( \mathbf{A}^k) = \lambda_1^k + \lambda_2^k + \cdots + \lambda_n^k. $$

于是我们可以将式 $(eq.1)$ 重写为
$$\sum_{i=1}^{n}{\sum_{k=1}^{\infty}{\frac{1}{k}\lambda_{i}^k}}.\quad(eq.2)$$

上式中的$\sum_{k=1}^{\infty}{\frac{1}{k}\lambda_{i}^k}$
正是一幂级数形式的无穷和.

考察幂级数
$$p(x)=\sum_{k=1}^{\infty}{\frac{1}{k}x^k} \quad ( x < 1).$$
容易判断, 上面这个幂级数在 $x < 1$ 这个范围内一致收敛, 求这个幂级数的和.
$$p’(x)=\sum_{k=1}^{\infty}{\left(\frac{1}{k}x^k\right)’}=\sum_{k=1}^{\infty}{x^{k-1}}=\lim_{k\rightarrow\infty}{\frac{1-x^{k-1}}{1-x}}=\frac{1}{1-x}.$$
所以
$$p(x)=\int_{0}^{x}{p’(x)dx}=-\ln (1-x).$$

那么式 $(eq.2)$ 就等于
$$\sum_{i=1}^{n}{p(\lambda_{i})} = - \sum_{i=1}^{n}{\ln (1-\lambda_{i})} = -\ln{\prod_{i=1}^{n}{(1-\lambda_{i})}}.\quad(eq.3)$$

现在我们看式 $(eq.1)$ 的左边, 对于矩阵 $\mathbf{A}$, 根据若尔当标准型的结果, 存在一个与之相似的若尔当标准型 $\mathbf{J}$:使得 $\mathbf{A=PJP^1}$, 其中 $\mathbf{P}$ 是一个可逆矩阵. 所以,
$$\mathbf{I-A}=\mathbf{I-A=I-PJP^{-1}=P(I-J)P^{-1}}$$
由行列式的性质
$$\det\mathbf{P(I-J)P^{-1}}=\det\mathbf{P}\cdot\det\mathbf{(I-J)}\cdot\det\mathbf{P^{-1}}=\det\mathbf{(I-J)}.$$

而矩阵 $\mathbf{A}$ 的若尔当标准型 $\mathbf{J}$ 是一个上三角矩阵, 其 $n$ 个对角线元素为矩阵 $\mathbf{A}$ 的特征值, 所以 $\det\mathbf{(I-J)}$ 的值就是其对角线元素 $1-\lambda_i$ 相乘,即
$$\prod_{i=1}^{n}{(1-\lambda_{i})}.$$

至此, 显然, 待证式两端相等, 证毕. $\square$

作者

Zengfk

发布于

2017-07-21

更新于

2019-08-04

许可协议

评论