匿名用户
1级
2017-06-20 回答
虽然一般的16S或者宏基因组等分析e69da5e6ba90e799bee5baa6e79fa5e9819331333363373762流程当中都会包含PCoA分析,但如果自己想要更改分组的形状,或者挑选特定的OTU进行分析,那么自己进行操作会高效很多。
PCoA的作图主要分为三个步骤:
选择特定的相似性距离并计算距离矩阵。距离的选择可以有Bray-curits、Unifrac等,不同的距离有不同的作用和意义(具体可以参考 微生物β多样性常用计算方法比较)。相似性距离可以利用R的GUniFrac和vegan等包计算,也可以利用QIIME计算。
进行PCoA分析,也就是利用表征分析选择最能表示样本距离的坐标轴。这个可以利用R的ape包的pcoa()命令完成。
PCoA图形展示。图形可以用ordiplot()命令展示,但如果需要比较美观的图形,建议用ggplot来画。
下面我们以R为基础,展示如何根据Unweighted Unifrac距离来画PCoA图:
----------------------代码开始了-----------------------
###导入需要的R包
library(GUniFrac) #用于计算Unifrac距离
library(ape) # 用于pcoa分析
library(ggplot2) #用于画图
##读文件
Otu_tab
Tree
Otu_tab
Otu_tab_rff
unifracs
du
Group
shape
color
PCOA
result
pro1 = as.numeric(sprintf("%.3f",result[1]))*100
pro2 = as.numeric(sprintf("%.3f",result[2]))*100
x = PCOA$vectors
sample_names = rownames(x)
pc = as.data.frame(PCOA$vectors)
pc$names = sample_names
legend_title = ""
group = Group
pc$group = group
xlab=paste("PCOA1(",pro1,"%)",sep="")
ylab=paste("PCOA2(",pro2,"%)",sep="")
pca=ggplot(pc,aes(Axis.1,Axis.2)) + #用ggplot作图
geom_point(size=3,aes(color=group,shape=group)) +
# geom_text(aes(label=names),size=4,vjust=-1) +
labs(x=xlab,y=ylab,title="PCOA",color=legend_title,shape=legend_title) +
geom_hline(yintercept=0,linetype=4,color="grey") +
geom_vline(xintercept=0,linetype=4,color="grey") +
scale_shape_manual(values=shape) +
scale_color_manual(values=color) +
theme_bw()
-------------------------代码结束------------------------
结果图展示:
输入OTU表格之后,运行上面代码,就可以出来图形(当然结果的数据输入是经过一定修改,自己根据需求定义样本数目,点的形状和颜色就可以)。