首页 > 编程知识 正文

可变对价是什么意思,leafcutter ants

时间:2023-05-03 21:36:47 阅读:275310 作者:2540

本文参考于生信技能树
利用leafcutter做可变剪切需要的材料是RNA-seq流程中所获得的bam类型的文件
首先是软件的安装:
1.源代码下载
git clone https://github.com/davidaknowles/leafcutter
#这条命令下载该软件的源代码,需要修改里面的一个脚本 scripts/bam2junc.sh 把软件路径增添进去即可,并将该软件路径添加到环境变量中
2.软件安装:
由于该软件是一个R包所以可以直接在R中安装这个包:
if (!require(“devtools”))
install.packages(“devtools”, repos=‘http://cran.us.r-project.org’)
devtools::install_github(“davidaknowles/leafcutter/leafcutter”)

另外也可以使用conda安装:
conda install -y -c davidaknowles r-leafcutter(我没成功)

正式流程
1.将bam文件转换位junc类型的文件:
*ls .bam >bam_dir.txt #构建bam的路径文件
cat bam_dir.txt|while read id; do file=$(basename i d ) ; s a m p l e = id ); sample= id);sample={file%%.*}; echo Converting $id to $sample.junc; touch $sample.junc; sh bam2junc.sh $id $sample.junc; done #利用循环将bam文件转换为junc文件

2.使用python脚本 leafcutter_cluster.py做 Intron clustering
*ls .junc >junc.txt #构建junc的路径文件
conda creat python27 python=2.7 #利用conda构建下一步需要的2.7环境(已有可以不做)
conda activate python27 #切换到python2.7环境
python /home/suly/biosoft/leafcutter/clustering/leafcutter_cluster.py -j junc.txt -m 50 -l 500000 -o testYRIvsEU #这一步需要python的2.7环境才能完成
这一步完成以后会获得以下几个文件,其中testYRIvsEU_perind_numers.counts.gz 相对重要,里面每一行都是一个内含子,每一列都是一个样本,写明了它们的表达值,这些数值就可以用来做可变剪切分析。

testYRIvsEU_perind_numers.counts.gz内容:
zcat testYRIvsEU_perind_numers.counts.gz|tail
3.制作分组矩阵进行差异分析

首先需要构建如下图所示的分组文件group_info.txt,值得提醒的是,该文件有且只能有2个分组

其次,还需要手动构建外显子文件
构建方式是从该基因组的注释gff文件中提取,该gff文件如下图所示:

cat model.gff3 |grep exon|cut -f1,4,5,7,9|cut -d"." -f1>exon.txt #灵活运用cut和grep命令获得所需文件,如下图所示:
leafcutter_ds.R --exon_file=exon.txt --num_threads 4 --min_samples_per_intron=3 testYRIvsEU_perind_numers.counts.gz group_info.txt* #–min_samples_per_intron:指一个分组中最少有几个样本
这一步完成后会得到以下两个文件:

4.使用R脚本 ds_plots.R 对差异分析结果进行可视化
ds_plots.R -e exon.txt testYRIvsEU_perind_numers.counts.gz group_info.txt leafcutter_ds_cluster_significance.txt*
这一步完成以后会得到一张pdf图片,所有的统计学显著的可变剪切形式都会可视化在这张图里面

5.准备注释文件以及准备可视化数据
leafcutter/leafviz/gtf2leafcutter.pl -o annotation …/ref/model.gff3
prepare_results.R -o testYRIvsEU.Rdata -m group_info.txt -f 0.05 -c testYRIvsEU testYRIvsEU_perind_numers.counts.gz leafcutter_ds_cluster_significance.txt leafcutter_ds_effect_sizes.txt annotation
#会得到一个名为testYRIvsEU的Rdata,如果文件没有后缀,自己加上就可用了

6.进行可视化
cd /home/suly/biosoft/leafcutter/leafviz
run_leafviz.R testYRIvsEU.Rdata
#进入含有run_leafviz.R的目录,使用上一步得到的Rdata文件,运行后会自动打开网页,在线可视化结果;关闭程序后网页连接中断。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。