当前位置：首页 > 网站优化 >

学习PCA算法，掌握主成分分析关键步骤，解锁数据降维应用场景！

GG网络技术分享 2025-11-13 01:20 7

根据您给的文章内容，

数据中心化 先说说我们需要对原始数据进行中心化处理，即将个个样本的个个维度减去该维度的平均值。对于样本向量 \ = ) 和 \ = )，我们Neng计算个个维度的平均值并从个个样本中减去。

所以呢，中心化后的数据为：
计算协方差矩阵 接下来我们计算中心化后数据的协方差矩阵。协方差矩阵 \ Neng：

其中 \ 是个个样本，\ 是个个维度的平均值。对于这两个样本，协方差矩阵 \ 为：

= \left ]

基本上原因是协方差矩阵是零矩阵，说明这两个样本在全部维度上dou是彻头彻尾相关的。
计算特征值和特征向量 由于协方差矩阵是零矩阵，它的特征值dou是零，且对应的特征向量Neng是任意向量。在这种情况下我们Neng选择任意一个非零向量作为主成分。
选择主成分 选择特征值Zui巨大的特征向量作为主成分。在这玩意儿例子中，我们Neng选择 \ ) 或 \ ) 作为主成分。
降维再说说我们将原始数据投影到选定的主成分上。对于样本 \ ) 和 \ )，它们在主成分 \ ) 上的投影值分别为：

所以呢，降维后的数据集包含一个维度，且两个样本在这玩意儿维度上的值dou是 1。

标签：

网站优化