首页 > 编程知识 正文

matlab中主成分分析函数pca,利用matlab进行主成分分析

时间:2023-05-05 12:16:39 阅读:201600 作者:390

《主成分分析法例子.[共20页]》由会员分享,可在线阅读,更多相关《主成分分析法例子.[共20页](20页珍藏版)》请在人人文库网上搜索。

1、PCA的基本原理 PCA的计算步骤 PCA应用实例,主成分分析(PCA)具体例子,繁荣的寒风,一、主成分分析的基本原理,假定有n个样本,每个样本共有p个变量,构成一个np阶的数据矩阵,1,降维处理,当p较大时,在p维空间中考察问题比较麻烦。 降维是用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的,定义:记x1,x2,xP为原变量指标,z1,z2,zm(mp)为新变量指标,2,系数lij的确定原则: wsdzxc与zj( ij;i,j=1,2,m )相互无关; z1是x1,x2,xP的一切线性组合中方差最大者,z2是与。

2、z1不相关的x1,x2,xP的所有线性组合中方差最大者; zm是与z1,z2,zm1都不相关的x1,x2,xP, 的所有线性组合中方差最大者。 则新变量指标z1,z2,zm分别称为原变量指标x1,x2,xP的第一,第二,第m主成分,从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 , p)在诸主成分wsdzxc(i=1,2,m)上的载荷 lij( i=1,2,m; j=1,2 ,p)。 从数学上可以证明,载荷lij分别是相关矩阵的m个较大的特征值所对应的特征向量,二、计算步骤,一)计算相关系数矩阵 rij(i,j=1,2,p)为原变量xi与xj的相关系数, rij=rji,其计算。

3、公式为,3,4,二)计算特征值与特征向量: 解特征方程,求出特征值,并使其按大小顺序排列,分别求出对应于特征值的特征向量 ,要求 =1,即,其中表示向量 的第j个分量,计算主成分贡献率及累计贡献率 贡献率,累计贡献率,一般取累计贡献率达8595%的特征值 所对应的第一、第二、第m(mp)个主成分,6,各主成分的得分,三、 主成分分析方法应用实例,表1 某农业生态经济系统各区域单元的有关数据,步骤如下: (1)将表1中的数据作标准差标准化处理,然后将它们代入公式(4)计算相关系数矩阵(见表2,表2相关系数矩阵,2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3)。由表3可知。

4、,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可,表3特征值及主成分贡献率,3)对于特征值=4.6610,=2.0890,=1.0430分别求出其特征向量l1,l2,l3,表4 主成分载荷,第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分z1是生态经济结构的代表。 第二主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的情况,因此可以认为第二主成分z2代表了人均资源量,分析,显然,用三个主成分z1、z2、z3代替原来9个变量(x1,x2,x9),描述农业生态经济系统,可以使问题更进一步简化、明了,第三主成分z3,与x8呈显出的正相关程度最高,其次是x6,而与x7呈负相关,因此可以认为第三主成分在一定程度上代表了农业经济结构,谢谢。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。