线性代数之 矩阵的特征值,特征向量和特征分解
前言特征值和特征向量求矩阵特征值矩阵的特征分解补充:实对称矩阵后记前言
矩阵的特征分解是比较基础的知识了,但是应用却十分广泛,比如主成分分析、矩阵分解之类的。现在回顾一下矩阵特征值的相关知识。
特征值和特征向量
定义:对于n阶实方阵AAA,如果存在非零向量xxx使得Ax=λx,λ∈RAx=\lambda x,\lambda \in RAx=λx,λ∈R,则称λ\lambdaλ是矩阵AAA的一个特征值,xxx是AAA的属于λ\lambdaλ的特征向量。
以上数学定义比较简单但是不够直观。从几何上更容易理解:矩阵乘法实际上是对向量的线性变换(也就是对向量旋转和伸缩),特征向量就是经过线性变换后方向不变的向量,特征值就是伸缩量。
求矩阵特征值
Ax=λx(λE−A)x=0矩阵方程有非零解,说明(λE−A)是奇异矩阵∣λE−A∣=0Ax=\lambda x \\ (\lambda E- A) x = 0 \\ \quad \\ 矩阵方程有非零解,说明(\lambda E- A)是奇异矩阵\\ \quad \\ |\lambda E- A|=0 Ax=λx(λE−A)x=0矩阵方程有非零解,说明(λE−A)是奇异矩阵∣λE−A∣=0
∣λE−A∣|\lambda E- A|∣λE−A∣是矩阵AAA的特征多项式,求解得到AAA的所有特征值,然后将特征值带回Ax=λxAx=\lambda xAx=λx得到对应的特征向量。
不同特征值的特征向量是线性无关的,证明如下:
Ax1=λ1x1Ax2=λ2x2如果x1,x2线性相关,则存在非全零k1,k2使得k1x1+k2x2=0x1=−k2x2/k1−Ak2x2/k1=−λ1k2x2/k1Ax2=λ1x2这样x2就是λ1的特征向量了,与题设矛盾,得证Ax_1=\lambda_1 x_1 \\ Ax_2=\lambda_2 x_2 \\ \quad \\ 如果x_1,x_2线性相关,则存在非全零k_1,k_2使得 \\ \quad \\ k_1x_1+k_2x_2 = 0 \\ x_1 = -k_2x_2/k_1 \\ -Ak_2x_2/k_1=-\lambda_1k_2x_2/k_1 \\ Ax_2=\lambda_1 x_2 \\ \quad \\ 这样x_2就是\lambda_1的特征向量了,与题设矛盾,得证 Ax1=λ1x1Ax2=λ2x2如果x1,x2线性相关,则存在非全零k1,k2使得k1x1+k2x2=0x1=−k2x2/k1−Ak2x2/k1=−λ1k2x2/k1Ax2=λ1x2这样x2就是λ1的特征向量了,与题设矛盾,得证
同一特征值的不同特征向量,可能相关也可能无关,取决于代入特征值后,齐次线性方程组对应矩阵的秩。
矩阵的特征分解
n阶矩阵A能够特征分解的充要条件是,A有n个线性无关的特征向量。
求出矩阵所有特征值和特征向量后:
Ax1=λ1x1Ax2=λ2x2Ax3=λ3x3A[x1,x2,x3]=[λ1x1,λ2x2,λ3x3]=[x1,x2,x3]diag[λ1,λ2,λ3]A=[x1,x2,x3]diag[λ1,λ2,λ3][x1,x2,x3]−1A=XΛX−1Ax_1=\lambda_1 x_1 \\ Ax_2=\lambda_2 x_2 \\ Ax_3=\lambda_3 x_3 \\ A[x_1,x_2,x_3]=[\lambda_1 x_1, \lambda_2 x_2, \lambda_3 x_3] \\ = [x_1,x_2,x_3]diag[\lambda_1,\lambda_2, \lambda_3] \\ A = [x_1,x_2,x_3]diag[\lambda_1,\lambda_2, \lambda_3] [x_1,x_2,x_3]^{-1} \\ \quad \\ A=X\Lambda X^{-1} Ax1=λ1x1Ax2=λ2x2Ax3=λ3x3A[x1,x2,x3]=[λ1x1,λ2x2,λ3x3]=[x1,x2,x3]diag[λ1,λ2,λ3]A=[x1,x2,x3]diag[λ1,λ2,λ3][x1,x2,x3]−1A=XΛX−1
以上就是特征分解的过程。
补充:实对称矩阵
如果元素全是实数并且A=ATA=A^TA=AT,则A是实对称矩阵。
实对称矩阵具有几个有用的性质:
性质1.特征值和特征向量都是在实数域内。
性质2.不同特征值对应的特征向量正交。
性质3.n重特征值有n个线性无关的特征向量。
性质4.实对称矩阵一定能够特征分解。
后记
矩阵的特征值和特征向量给出了一种可能的将矩阵分解的方法:特征分解(矩阵对角化)。下一次将介绍矩阵的另一种特性:奇异值与奇异分解。