PCA (principalcomponentsanalysis )主成分分析,这是用于数据预处理的数据维度缩减算法。 一般情况下,我们获得的原始数据维数较高,因此可以使用PCA算法降低特征维数。 由此,不仅可以去除不必要的噪声,还可以减少很大的计算量。
PCA的算法步骤:
有m条n维数据。
将原始数据按列构成n行m列矩阵x; 对x的每一行(表示属性字段)进行零平均,即减去该行的平均值。 求协方差矩阵C=1mXXTC=1mXXT; 将求出与协方差矩阵特征值对应的特征向量的特征向量以对应的特征量的大小从上向下逐行排列成矩阵,构成取最初的k行的矩阵p; Y=PXY=PX是将维度降级到k维的数据。