主成分分析法 PCA 是什么
主成分分析法 PCA 是什么
主成分分析法(Principal Component Analysis,简称PCA)是一种数据降维与特征提取方法,核心思想是通过线性变换将高维数据映射到低维空间,在尽可能保留原始数据“信息量”(即方差)的同时,减少数据维度,消除特征间的相关性。
主成分分析法(PCA)是一种通过线性变换将高维数据映射到低维空间的降维方法,核心是保留数据中方差最大的方向(主成分),在减少维度的同时保留主要信息。
一、举例说明计算过程(以二维数据降维到一维为例)
假设我们有3个样本的二维数据(比如“语文成绩”和“数学成绩”):
样本数据:X=[123456]\mathbf{X} = \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}X=