首页 > 编程知识 正文

可变剪接,可变剪接的几种形式

时间:2023-05-04 16:54:39 阅读:275298 作者:839

可变剪切可视化 rmats2sashimiplot (python=2.7,conda update conda)

官网流程:

https://github.com/Xinglab/rmats2sashimiplot(打开的时候开VPN)

1、安装

可以用conda安装

conda install -c bioconda rmats2sashimiplot

安装好之后输入 rmats2sashimiplot -h

出现帮助文档即可以使用

按照官网给的方法安装:

(1)下载安装包到本地,并解压好,将解压好的文件拖到服务器中

(2)安装依赖:conda install 安装即可

(3)进入到rmats2sashimiplot-master的文件夹里,给**setup.py 777的权限,执行python ./setup.py install** 安装rmats2sashimiplot

(4)输入**rmats2sashimiplot -h** 出现帮助文档,即可使用

2、运行:

用sam文件:

rmats2sashimiplot --s1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.sam,./rmats2sashimiplot_test_data/sample_1_replicate_2.sam,./rmats2sashimiplot_test_data/sample_1_replicate_3.sam --s2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.sam,./rmats2sashimiplot_test_data/sample_2_replicate_2.sam,./rmats2sashimiplot_test_data/sample_2_replicate_3.sam -t SE -e ./rmats2sashimiplot_test_data/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_events_output

用bam文件:

1、带 -c 坐标的:

rmats2sashimiplot --b1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.bam,./rmats2sashimiplot_test_data/sample_1_replicate_2.bam,./rmats2sashimiplot_test_data/sample_1_replicate_3.bam --b2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.bam,./rmats2sashimiplot_test_data/sample_2_replicate_2.bam,./rmats2sashimiplot_test_data/sample_2_replicate_3.bam -c chr16:+:9000:25000:./rmats2sashimiplot_test_data/annotation.gff3 --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output

1、bam文件为hisat2 比对得出的bam文件

2、给文件sort以下,并给sort好的bam文件建索引

3、使用sort之后的sort_bam文件,进行rmats2sashimiplot 可视化

4、-c 座标后面的参考基因组注释文件用 gff 3格式,并且和所要用的bam文件放在同一个目录下,即 -c 染色体:起始:终止-1:正负链:./参考基因组注释文件

5、这里的需要可视化SE.MATS.JC.txt的文档,里面有几条内容,就会生成几个图片,所以需要自己去挑选一下,挑选的时候,尽量不要选存在 NA 的值。

运行代码:

rmats2sashimiplot --b1 ./sample1_sort.bam,./sample2_sort.bam,./sample3_sort.bam --b2 ./1_sort.bam,./2_sort.bam,./3_sort.bam -c chr16:+:9000:25000:./annotation.gff3 -t SE -e /www/data/gaoshuang/cleanData/hisat2-bam/output_b8/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output

不带-c座标:

rmats2sashimiplot --b1 ./sample1_sort.bam,./sample2_sort.bam,./sample3_sort.bam --b2 ./1_sort.bam,./2_sort.bam,./3_sort.bam -t SE -e /www/data/gaoshuang/cleanData/hisat2-bam/output_b8/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output

2、不带 -c 坐标的:(输出的图片同sam文件)

rmats2sashimiplot --b1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.bam,./rmats2sashimiplot_test_data/sample_1_replicate_2.bam,./rmats2sashimiplot_test_data/sample_1_replicate_3.bam --b2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.bam,./rmats2sashimiplot_test_data/sample_2_replicate_2.bam,./rmats2sashimiplot_test_data/sample_2_replicate_3.bam -t SE -e ./rmats2sashimiplot_test_data/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_grouped_output

–s:输入的文件格式为sam文件(参考组和对照组),每个sam文件前面都要带路径

–b:输入的文件格式为bam文件(参考组和对照组),每个bam文件前面都要带路径

-t:输入的可变剪切事件的类型

-e:rmats定量输出的结果文件,如果-t是SE,则这部分输入的为SE.MATS.JC.txt 文件

–l1,–l2:输出的对照组和参考组对应的名字(可以自己起)

-o:输出的文件名称

-c:染色体的座标 (染色体:正负链:开始:终止: + gff3格式的注释文件) 这个座标应该可以根据sam文件输出的结果txt表格中,去查看

使用过程中,缺少libgfortran.so.1,出现以下问题的解决方法:

解决方法:conda install libgfortran==1

可视化的文件在plot的文件里,为pdf

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。