网站优化

网站优化

Products

当前位置:首页 > 网站优化 >

学习PCA算法,掌握主成分分析关键步骤,解锁数据降维应用场景!

GG网络技术分享 2025-11-13 01:20 5


根据您给的文章内容,

  1. 数据中心化 先说说我们需要对原始数据进行中心化处理,即将个个样本的个个维度减去该维度的平均值。对于样本向量 \ = ) 和 \ = ),我们Neng计算个个维度的平均值并从个个样本中减去。

    所以呢, 中心化后的数据为:

  2. 计算协方差矩阵 接下来我们计算中心化后数据的协方差矩阵。协方差矩阵 \ Neng:

    其中 \ 是个个样本,\ 是个个维度的平均值。对于这两个样本, 协方差矩阵 \ 为:

    = \left ]

    基本上原因是协方差矩阵是零矩阵,说明这两个样本在全部维度上dou是彻头彻尾相关的。

  3. 计算特征值和特征向量 由于协方差矩阵是零矩阵, 它的特征值dou是零,且对应的特征向量Neng是任意向量。在这种情况下我们Neng选择任意一个非零向量作为主成分。

  4. 选择主成分 选择特征值Zui巨大的特征向量作为主成分。在这玩意儿例子中,我们Neng选择 \ ) 或 \ ) 作为主成分。

  5. 降维 再说说我们将原始数据投影到选定的主成分上。对于样本 \ ) 和 \ ), 它们在主成分 \ ) 上的投影值分别为:

    所以呢,降维后的数据集包含一个维度,且两个样本在这玩意儿维度上的值dou是 1。

标签:

提交需求或反馈

Demand feedback