文章目录概念应用场景优势劣势spss实例8、原始特征数据标准化计算过程
概念非监督学习降维方法只能通过特征量的分解来压缩数据。 消除噪声的目的是利用降维思想,将多指标按少数几个的综合指标的各主要成分反映出原变量的信息的大部分,而且信息不会重复应用于场景
在某些图像矩阵中,某些因素特征不明显,不易识别,但某些因素特征明显,表明其方差较大。 元素方差可以测量整个样本的离散度。 这些因素是图像识别的主要依据
PCA的作用是消除方差小、特征不清晰的维度,保留方差大、特征清晰的维度
优缺点只是用方差度量信息量,不受数据集其他因素的影响
各主成分正交,
计算方法简单,主要运算为模态分解,易于实现
缺点主成分各特征维度的语义存在一定的模糊性,强于原始样本特征的描述
方差较小的非主成分也可能包含样本差异的重要信息,降维丢弃可能影响后续数据处理
spss实例1,在有缺失值情况下,首先处理数据
2、将处理后的数据导入spss
3、找出主成分分析
4、引入非分类列。 在我这个案例中,有审查列,也没有必要放进去。 因为不是影响因素
5、校验系数:生成成分得分系数矩阵进行最后得分计算
6、勾选碎石图:可实现更直观的主成分分布,点击确定
点击进行计算。 导出结果
7、查看总方差说明图。 提取的载荷平方和的个数为主要成分的个数。 最后的主要成分所占的比例是所有被选中的主要成分所占比例的总和
8、标准化原始特征数据
检查:为了给变量命名而被捕
9 )进行用归一化数据与系数得分矩阵建立对应乘法运算
计算过程
x是所有的特征变量
f1=0.073x10.0008x2 ) . 0.203x11 f1=-0.073 * x1-0.0008 * x2 (. 0.203 * X11 f1=0.073 x 10.0008 x2 ) . 0.203 X11
f2=0.372x10.157x2 ) . 0.123X11F2=-0.372*x1-0.157*x2 ) .-0.123*x11F2=0.372x1.157x2 ) . 0.123x11
f=(23.2/70.3 ) f1 ) 14.0/70.3 ) f2.f=) 23.2/70.3 ) f1 ) 14.0/70.3 ) f2 . ) f1) 14.0/70.3 ) f2) f2) 14.0.f .