Products
GG网络技术分享 2025-11-13 01:20 5
根据您给的文章内容,
数据中心化 先说说我们需要对原始数据进行中心化处理,即将个个样本的个个维度减去该维度的平均值。对于样本向量 \ = ) 和 \ = ),我们Neng计算个个维度的平均值并从个个样本中减去。

所以呢, 中心化后的数据为:
计算协方差矩阵 接下来我们计算中心化后数据的协方差矩阵。协方差矩阵 \ Neng:
其中 \ 是个个样本,\ 是个个维度的平均值。对于这两个样本, 协方差矩阵 \ 为:
= \left ]
基本上原因是协方差矩阵是零矩阵,说明这两个样本在全部维度上dou是彻头彻尾相关的。
计算特征值和特征向量 由于协方差矩阵是零矩阵, 它的特征值dou是零,且对应的特征向量Neng是任意向量。在这种情况下我们Neng选择任意一个非零向量作为主成分。
选择主成分 选择特征值Zui巨大的特征向量作为主成分。在这玩意儿例子中,我们Neng选择 \ ) 或 \ ) 作为主成分。
降维 再说说我们将原始数据投影到选定的主成分上。对于样本 \ ) 和 \ ), 它们在主成分 \ ) 上的投影值分别为:
所以呢,降维后的数据集包含一个维度,且两个样本在这玩意儿维度上的值dou是 1。
Demand feedback