首页 > 编程知识 正文

qutest解码水平,qiime怎么读

时间:2023-05-04 18:03:39 阅读:40289 作者:4809

使用文章目录` q2-vsearch `集群数组为OTUs下载数据数组,未参加特征[频率]和特征数据[数组]的集群/从一开始就参加的集群的一半参加/开放自由

设q2-vsearch聚类序列为OTUs

Clustering sequences into OTUs using q2-vsearch

目前,QIIME2支持三种群集方法。 无参与(De novo )、有参与(closed-reference )、半参与(open-reference clustering,即参与一致后不能对照数组进行无参与聚类)。

当前,运行vsearch时,只能对分割的、质量控制的数据进行OTUs群集。 例如,SampleData[Sequences]对象或质控后的特征表和代表性序列(如FeatureTable[Frequency]和FeatureData[Sequence]对象,这些文件是qiime dada2 denoise-*或qiime deblur denoise-* 第二个选择一步就结束了。

QIIME 1用户:在QIIME 1中,使用split_libraries*.py命令对示例序列进行分割和质量滤波,生成文件为seqs.fna。

完成本教程后,您将知道如何从头运行、关闭引用群集和打开引用群集。 这将从加载到SampleData [Sequences]对象中的QIIME 1 seqs.fna文件进行介绍。 如果您已经有要群集的FeatureTable [Frequency]和FeatureData [Sequence]工件,请参见本教程中的FeatureTable [Frequency]和FeatureData [Sequence]

数据mkdir-potu-clusteringcdotu-clustering wget-c https://data.qi ime2. org/2020.11/tutorials/otu-clustering/seqs

如果使用分割示例和控制质量的序列(例如qiiime1的seqs.fna文件中的序列)开始分析,则第一步是将数据作为QIIME 1对象导入。 此处使用的语义类型为SampleData[Sequences],表示数据是一个或多个示例的序列集合。

iimetoolsimport--input-paths eqs.FNA--output-paths eqs.qza--type ' sampledata [ sequences ] ' 3http://wwww

以85_OTUs.qza:相似度85%聚类的otu。 查看|下载通过seqs.qza:导入的顺序文件。 查看|下载并导入后,使用dereplicate-sequences冗馀序列

iimevsearchdereplicate-sequences--I-sequencesseqs.qza--o-de复制表. qza--o-de复制表

rep-seqs.qza:表示序列。 查看|下载table.qza:的特性表。 查看|下载并冗馀序列的dereplicate-sequences的输出是FeatureTable[Frequency]和FeatureData[Sequence]对象。 FeatureTable[Frequency]对象是一个特征表,显示在每个示例中观察到的每个Amplicon序列变体(ASV )的次数。 FeatureData[Sequence]对象包含到定义特征序列变量的映射的每个功能标识符。 这些文件类似于qiime dada2 denoise-*和qiime deblur denoise-*生成的文件,但在去噪过程中没有应用去噪、嵌合消除或其他质量控制。 (在本例中,这些数据的唯一质量控制是在导入导入步骤之前,即在非QIIME 2程序中进行的。)

特征[频率]和特征数据[数组]的聚类Dereplicating a SampleData[Sequences] artifact

QIIME2的OTU群集当前应用于FeatureTable[Frequency]和FeatureData[Sequence]对象。 这些对象可以来自多种分析进程,如qiime vsearch dereplicate-sequen

ces(如上所示)、qiime dada2 denoise-*和qiime deblur denoise-*,或者下面所示的一个聚类过程(例如,以较低的百分比序列一致率对数据进行重新聚类)。

FeatureData[Sequence]对象中的序列两两比对(de novo 聚类)或比对参考数据库(closed-reference聚类),然后可折叠特征表FeatureTable中的特征,从而形成输入特征的新特征聚类。

无参/从头聚类

De novo clustering

特性表的无参(从头/新)聚类(De novo clustering)可以用如下命令实现。在这个例子中,聚类是按序列相似度99%的水平执行的,以创建99%的OTU。

qiime vsearch cluster-features-de-novo --i-table table.qza --i-sequences rep-seqs.qza --p-perc-identity 0.99 --o-clustered-table table-dn-99.qza --o-clustered-sequences rep-seqs-dn-99.qza

输出对象:

table-dn-99.qza: 99%相似度聚类的OTUs表。 查看 | 下载rep-seqs-dn-99.qza: 99%相似度聚类的代表序列。 查看 | 下载

该过程的输出是FeatureTable [Frequency]对象和FeatureData [Sequence]对象。 FeatureData [Sequence]对象将包含定义每个OTU聚类的**质心(centroid)**序列,即最高丰度序列。

有参聚类

Closed-reference clustering

特性表的有参聚类可以用如下方法执行。在这个例子中,聚类是在85%的一致性下对GreenGenes 13_8 85%的OTU参考数据库进行比对的。参考数据库作为FeatureData[Sequence]对象。

注释:有参OTU聚类通常以更高的相似度合并,但这里使用85%,因此本教程的用户不必下载更大的参考数据库。通常,在某个百分比处对聚集在同一百分比相似度的参考数据库执行聚类,但这并没有正确地进行基准测试,以确定它是否是执行有参聚类的最佳方法。

qiime vsearch cluster-features-closed-reference --i-table table.qza --i-sequences rep-seqs.qza --i-reference-sequences 85_otus.qza --p-perc-identity 0.85 --o-clustered-table table-cr-85.qza --o-clustered-sequences rep-seqs-cr-85.qza --o-unmatched-sequences unmatched-cr-85.qza

输出对象:

table-cr-85.qza: 特征表。 查看 | 下载unmatched-cr-85.qza: 无法比对的序列。 查看 | 下载rep-seqs-cr-85.qza: 代表序列。 查看 | 下载

cluster-features-closed-reference输出的结果是一个FeatureTable[Frequency]对象和一个FeatureData[Sequence]对象。在这种情况下,序列FeatureData[Sequence]对象不是定义FeatureTable中特征的序列,而是特征ID及其按85%相似度匹配序列的集合。作为输入提供的参考序列被用作定义有参OTU中的特征序列。

半有参/开放参考聚类

Open-reference clustering

像上面的有参聚类示例一样,可以使用qiime vsearch cluster-features-open-reference命令执行半有参(开放参考)聚类。

注:半有参OTU聚类通常以更高的百分比一致率执行,但这里使用85%,因此本教程的用户不必下载更大的参考数据库。通常,在某个百分比一致率对有相同百分比一致率聚类的参考数据库执行聚类,但这并没有正确地进行基准测试,以确定它是否是执行半有参(开放参考)聚类的最佳方法。

qiime vsearch cluster-features-open-reference --i-table table.qza --i-sequences rep-seqs.qza --i-reference-sequences 85_otus.qza --p-perc-identity 0.85 --o-clustered-table table-or-85.qza --o-clustered-sequences rep-seqs-or-85.qza --o-new-reference-sequences new-ref-seqs-or-85.qza

输出对象:

new-ref-seqs-or-85.qza: 新参考序列。 查看 | 下载rep-seqs-or-85.qza: 代表序列。 查看 | 下载table-or-85.qza: 特征表。 查看 | 下载

cluster-features-open-reference输出结果是一个FeatureTable[Frequency]对象和两个FeatureData[Sequence]对象。其中一FeatureData[Sequence]对象表示聚集的序列,而另一个对象表示新的参考序列,由用于输入的参考序列以及作为内部重新聚集步骤的一部分聚集的序列组成。

译者简介

hxdwn,博士,中科院青促会会员,QIIME 2项目参与人。2008年毕业于东北农业大学微生物学专业,2014年于中国科学院大学获生物信息学博士,2016年遗传学博士后出站留所工作,任工程师。目前主要研究方向为宏基因组数据分析。目前在***Science、Nature Biotechnology、Protein & Cell、Current Opinion in Microbiology***等杂志发表论文30余篇,被引2千余次。2017年7月创办“宏基因组”公众号,目前分享宏基因组、扩增子原创文章2400余篇,代表作有《扩增子图表解读、分析流程和统计绘图三部曲(21篇)》、 《微生物组实验手册》、《微生物组数据分析》等,关注人数11万+,累计阅读2100万+。

Reference

https://docs.qiime2.org/2020.11

Evan Bolyen*, Jai Ram Rideout*, Matthew R. Dillon*, Nicholas A. Bokulich*, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, sqdjb M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan 怕黑的大碗s, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, 醉熏的饼干 J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, radsy B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, yqdyb J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob 怕黑的大碗 & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

猜你喜欢 10000+: 菌群分析
宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑系列教程:微生物组入门 Biostar 微生物组 宏基因组专业技能:生信宝典 学术图表 高分文章 不可或缺的人一文读懂:宏基因组 寄生虫益处 进化树必备技能:提问 搜索 Endnote文献阅读 热心肠 SemanticScholar Geenmedical扩增子分析:图表解读 分析流程 统计绘图16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun在线工具:16S预测培养基 生信绘图科研经验:云笔记 云协作 公众号编程模板: Shell R Perl生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘 写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。