首页 > 编程知识 正文

pcoa和pca有什么区别

时间:2023-05-04 15:11:30 阅读:276487 作者:4497

PCA (principle component analysis)主成分分析:常用的降维算法,该方法是在样本*特征矩阵上直接进行特征转换,前提假设是数据点变化大的维度信息量更大,设法保留数据里的变异让点的位置尽量不要变动。
PCoA(principle coordination analysis)主坐标分析:是探索数据相似度或者相异度可视化方法。该方法是在样本距离矩阵上进行变换,尽量在低维空间保持样本在高维空间的距离关系

下面是pcoa方法的原理,转载于博客:http://blog.sina.com.cn/s/blog_670445240101nlss.html

PCoA, 这是一种排序方法。假设我们对N个样方有了衡量它们之间差异即距离的数据,就可以用此方法找出一个直角坐标系(最多N-1维),使N个样方表示成N个点,而使点间的刻苦的热狗距离的平方正好等于原来的差异数据。

主坐标分析是Gower(1966)建立的。因为样方间差异数据可用各种各样的办法给出, 这种方法用得很普遍。例如原来只知样本属甲型、乙型、丙型……等名称的区别,只要对不同型间的差异给以适当的数量描述,就可以用此方法求出各样方的数量坐标,从而实现定性数据的定量转换。

主坐标方法简单、明确、效率很高。它与主分量分析一样,最后找出的坐标系不仅正交, 而且第一轴、第二轴……依次按N个点在该轴上的方差大小顺序排列,N个点对不同两个轴都不相关。所以也可用较少的维数,特别是直观的二、三维空间去排列样方,而使信息的损失最少。它与主分量分析不同之处在于:不是先给出N个点的坐标,去找出刚性旋转的坐标;而是只知其间的距离要去重新建立各点的坐标。因此可以不限于度量(metrtic)的相似系数公式,Pernitec(1977)采用数量数据对于寒温带森林和草地进行主坐标分析,他认为非度量(non-mertic)相似系数比度量相似系数效果更佳。

 

主坐标分析的步骤如下:

1)构成样本间差异的数据矩阵M

  

M的数据一般不是生态工作者观察群落的原始记录,而是由原始记录推导出来的,它 有各种推导方法。

2)构成离差矩阵A

 

就求出A矩阵的元素。以后可知,它是最后求出的N个样方点坐标矩阵的离差矩阵。这里不必证明而列出A具有的三个性质:1,A是对称的,即aij~aji(i,j=1,2,……,N)2,A的行和及列和均等于0,即Ai.=A.i=0; 3, mij2=mji2=aii+ajj-2aij( i,j=1,2,……,N).

 

3)求出N个样方点的坐标矩阵C

因为A是NxN的对称实矩阵,所以必存在着酉矩阵(正交矩阵)U将A变换成对角矩B,即 UAU’=B,或A=U’BU。其中B的主对角线元素为λ1, λ2,……λN,分别 是A的N个依大小排 列的特征根,而U的每一行向量是相应的特征向量。

 

 4 ) 排列N个样方

根据C给出的N个样方的坐标值,可以在s维空间中排列样方,而不损失信息。 与主分量分析一 样 , 可以在较低K(< s)维空间中排列样方, 则保留的信息百分比为 :

 。特别是只选择二、三维主坐标就可直观地画出它们的排序图形

 



xia

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。