解题笔记:一道简单的高等代数综合性题目
看到一道不难但是很有意思的综合性习题. 好吧, 事实上这是 2017 年中山大学研究生入学考试[高等代数]科目的最后一道题. 这道题将数学分析和高等代数的知识结合在一起, 值得一看. 也作为自己对相关知识点的一个小小的复习. 下面就是原题题目.
这里重述一下题目
设 A 是一个 n 阶实矩阵, 其有 n 个绝对值小于 1 的实特征值, 证明: ln(det 其中 \ln 为自然对数, \mathbf{I} 表示 n 阶单位矩阵, \det \mathbf{A} 表示 \mathbf{A} 的行列式, tr (\mathbf{A}) 表示 \mathbf{A} 的迹.
一些概念
解题前先复习一些概念及相关的性质.
迹
迹 的定义
在线性代数中, 一个 n\times n 的矩阵 \mathbf{A} 的迹(或迹数), 是指 \mathbf{A} 的主对角线(从左上方至右下方的对角线)上各个元素的总和, 一般记作 tr(\mathbf {A}):
$$tr(\mathbf{A} )=\mathbf{A} _{1,1}+\mathbf{A} _{2,2}+\cdots +\mathbf{A} {n,n}$$
其中 $\mathbf{A}{i, j}$ 代表矩阵的第i行j列上的元素的值. 一个矩阵的迹是其特征值的总和(按代数重数计算).
迹的英文为 trace, 在数学中, 通常简写为 “tr”.
迹 的性质
迹是一个线性算子(或者说一个线性函数), 所以具有一般线性算子的所有性质:
tr(\mathbf{A} + \mathbf{B}) = tr(\mathbf{A}) + tr(\mathbf{B})
tr(r \cdot \mathbf{A} ) = r \cdot tr(\mathbf{A})
另外, 一个 n\times n 矩阵转置后对角线上的元素不发生变化, 所以有
tr(\mathbf{A} ) = tr\left(\mathbf{A}^T \right)
同时, 关于矩阵的迹和特征值, 还有以下关系
tr( \mathbf{A}) = \lambda_1 + \lambda_2 + \cdots + \lambda_n
其中的 \lambda_1,\lambda_2 \cdots \lambda_n 是矩阵的特征值. 而且有:
\forall m \in \mathbb{N}, tr( \mathbf{A}^m) = \lambda_1^m + \lambda_2^m + \cdots + \lambda_n^m
关于迹的更多内容参考: 迹 - 维基百科, 自由的百科全书
Jordan 标准型
关于 Jordan 标准型的详细内容, 请参考: 若尔当标准型 - 维基百科, 自由的百科全书
这里仅复述几个高等代数中关于若尔当(Jordan)标准型的结果:
对任意系数域为 \mathbb {K} 的矩阵 \mathbf{A}, 只要其特征值都在 \mathbb {K} 中, 就存在一个与之相似的若尔当标准型 \mathbf{J}:使得 \mathbf{A=PJP^1}, 其中 \mathbf{P} 是一个可逆矩阵. 并且满足:
- 矩阵 \mathbf{J} 的特征值(计入重数)就是主对角线上的系数.
- 对于 \mathbf{J} 的一个特征值 \lambda_i, 它的几何重数就是属于特征值 \lambda_i 的若尔当块的个数.
- 所有属于特征值 \lambda_i 的若尔当块的维数之和是特征值 \lambda_i 的代数重数.
幂级数
级数理论是数学分析中很重要的一部分基础内容. 幂级数就是函数项级数中的一个常用的例子. 关于函数项级数, 主要研究的有收敛性, 极限(和)函数的连续性、可微性、可积性等内容. 为了保证极限(和)函数能保留通项具有的性质, 便有了一致收敛性.
幂级数在其收敛域上保持连续性、可微性、可积性, 即:
**连续性**:幂级数 \sum_{n=0}^{\infty}{a_{n}x^{n}} 的和函数 s(x)在其收敛域 D上连续.
**可积性**:幂级数 \sum_{n=0}^{\infty}{a_{n}x^{n}} 的和函数 s(x) 在其收敛域 D 上可积, 且有逐项积分公式: \int_{a}^{b}{\sum_{n=0}^{\infty}{a_{n}x^{n}} dx} = \sum_{n=0}^{\infty}{\int_{a}^{b}{a_{n}x^{n} dx}} 且逐项积分后的级数与原级数有相同的收敛半径.
**可微性**:幂级数 \sum_{n=0}^{\infty}{a_{n}x^{n}} 的和函数 s(x)在其收敛域 D 上可微, 且有逐项求导公式: \left(\sum_{n=0}^{\infty}{a_{n}x^{n}}\right)' = \sum_{n=0}^{\infty}{\left(a_{n}x^{n}\right)'} 且逐项求导后的级数与原级数有相同的收敛半径.
原题的解题过程
看到题目第一眼, 应该考虑到从化简待证式右边入手.
右边
\sum_{k=1}^{\infty}{\frac{1}{k}tr(\mathbf{A}^{k})}\quad(eq.1)
是一个无穷级数. 我们设矩阵 \mathbf{A} 的 n 个特征值为 \lambda_1,\lambda_2 \cdots \lambda_n.
首先, 由迹的性质, 对于每一个 k, 有
tr( \mathbf{A}^k) = \lambda_1^k + \lambda_2^k + \cdots + \lambda_n^k.
于是我们可以将式 (eq.1) 重写为
\sum_{i=1}^{n}{\sum_{k=1}^{\infty}{\frac{1}{k}\lambda_{i}^k}}.\quad(eq.2)
上式中的\sum_{k=1}^{\infty}{\frac{1}{k}\lambda_{i}^k}
正是一幂级数形式的无穷和.
考察幂级数
p(x)=\sum_{k=1}^{\infty}{\frac{1}{k}x^k} \quad ( x < 1).
容易判断, 上面这个幂级数在 x < 1 这个范围内一致收敛, 求这个幂级数的和.
p’(x)=\sum_{k=1}^{\infty}{\left(\frac{1}{k}x^k\right)’}=\sum_{k=1}^{\infty}{x^{k-1}}=\lim_{k\rightarrow\infty}{\frac{1-x^{k-1}}{1-x}}=\frac{1}{1-x}.
所以
p(x)=\int_{0}^{x}{p’(x)dx}=-\ln (1-x).
那么式 (eq.2) 就等于
\sum_{i=1}^{n}{p(\lambda_{i})} = - \sum_{i=1}^{n}{\ln (1-\lambda_{i})} = -\ln{\prod_{i=1}^{n}{(1-\lambda_{i})}}.\quad(eq.3)
现在我们看式 (eq.1) 的左边, 对于矩阵 \mathbf{A}, 根据若尔当标准型的结果, 存在一个与之相似的若尔当标准型 \mathbf{J}:使得 \mathbf{A=PJP^1}, 其中 \mathbf{P} 是一个可逆矩阵. 所以,
\mathbf{I-A}=\mathbf{I-A=I-PJP^{-1}=P(I-J)P^{-1}}
由行列式的性质
\det\mathbf{P(I-J)P^{-1}}=\det\mathbf{P}\cdot\det\mathbf{(I-J)}\cdot\det\mathbf{P^{-1}}=\det\mathbf{(I-J)}.
而矩阵 \mathbf{A} 的若尔当标准型 \mathbf{J} 是一个上三角矩阵, 其 n 个对角线元素为矩阵 \mathbf{A} 的特征值, 所以 \det\mathbf{(I-J)} 的值就是其对角线元素 1-\lambda_i 相乘,即
\prod_{i=1}^{n}{(1-\lambda_{i})}.
至此, 显然, 待证式两端相等, 证毕. \square
解题笔记:一道简单的高等代数综合性题目
未找到相关的 Issues 进行评论
请联系 @zengfk 初始化创建