首页 > 编程知识 正文

bowtie2序列比对原理,Bowtie2

时间:2023-05-06 08:01:42 阅读:243125 作者:2714

bowtie2  是bowtie的升级版,index不能混用。具体不同点,请参考这里。

1. 建立索引 bowtie2-build -f hg38.fa ./bowtie2_index/hg38# -f 可以省略,默认是fasta格式# 从索引导出序列bowtie2-inspect bowtie2-inedx > ref.fa# 查看参看基因组名称bowtie2-inspect -n bowtie2-inedx

注:时间很长,macbook(i5,16G)上运行四个多小时。生成.bt2 结尾的六个文件,某些基因组的index文件可以从这里下载。

2. 比对单端(single end,PE)测序数据

用法:bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> | -U <r> | --interleaved <i> | -b <bam>} [-S <sam>]

# 利用参数 -Sbowtie2 -p 10 -x hg38 -U test_read.fq.gz -S bt_se_test.sam# 重定向bowtie2  -x hg38 -U test_read.fq.gz > bt_se_test.sam# 管道连接samtoolsbowtie2 -p 10 -x hg38 -U test_read.fq.gz|samtools view -bS|samtools sort > test_sorted.bam

参数解释:

-p 线程

-x  基因组索引文件前缀,不写路径表示当前路径下

-S <sam>      File for SAM output (default: stdout)

--end-to-end      entire read must align; no clipping (可以省略,默认开启)

--phred33          qualities are Phred+33 (可以省略,默认开启)

3. 比对双端测序(pair end,PE)数据 bowtie2 -x hg38 -1 test_read1.fq.gz -2 test_read2.fq.gz -S bt_test_pe.sam 4. 局部比对 bowtie2  -x hg38 --local -U test_read.fq.gz -S bt_local_se_test.sambowtie2 -x hg38 --local -1 test_read1.fq.gz -2 test_read2.fq.gz -S bt_local_test_pe.sam

--local  局部比对,read两头的序列不参与比对打分,相当于soft clipping。

参考

Bowtie 2: Manual

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。