首页 > 编程知识 正文

生信分析数据库有哪些,生信常用数据库

时间:2023-05-03 12:36:11 阅读:267597 作者:659

所谓工欲善其事,必先利其器,从今天开始,我们来介绍TCGA数据库的使用。今天我们来介绍一款非常容易上手的数据库:GEPIA2 链接点这里 话不多说,直接进入正题

GEP1A2数据来源


如图所示,GEPIA2数据来源于TCGA和GTEx数据库。TCGA我们已经介绍过,不过GEPIA2对TCGA数据经过了筛选,具体筛选标准并没有详细介绍。比如肝癌TCGA有372例肿瘤组织,这里只有369例。
下面简单介绍一下GTEx

GTEx

GTEx(Genotype-Tissue Expression)
该项目研究来自449名生前健康的人类捐献者的7000多份尸检样本,涵盖44个组织(42种不同的组织类型),包括31个实体器官组织、10个脑分区、2个来自捐献者血液和皮肤的细胞系。GTEx可以有效弥补TCGA正常组织不多的缺点。

GEP1A2工作流程

下面我们来熟悉这个数据库的使用

基因一般性分析

我们以LDHA为例可以检索到LDHA的基因信息

LDHA的泛癌表达情况

LDHA的泛癌表达情况柱状图


然而我认为,没有统计的图都是耍流氓

差异分析

我们通过点击鼠标可以轻易获得一个肿瘤的差异分析结果。GEPIA2的差异分析结果默认是利用TCGA的肿瘤组织与GTEx的正常组织做对比。

可以得到一个差异基因与染色体位置的图,以及差异分析结果的文件,都是可以下载的。 得到的差异分析文件例只有差异基因 ,没有其他基因的情况。做一个火山图看一下差异基因大致的范围。

表达DIY


我们可以根据这种条件选择,得到目的基因的表达情况


肝癌TCGA中TP53的表达


TCGA联合GTEx中TP53的表达情况


肝癌各分期中TP53的表达


多基因表达热图

生存分析


输入基因名,选择OS还是RFS,设定cutoff比例,以及自定义颜色等,点击add添加感兴趣的癌症类型,点击plot就可以得到最终的生存分析结果

LDHA在肝癌中的OS

还可以看某个肿瘤中生存分析p值最小的前500个基因,如下入:

如果想看多个基因在多个癌症中与生存的关联,可以利用survival map工具,输入基因列表和癌症列表,得到每个癌症中每个基因与生存的显著性p值

Isoform分析

isoform分析与gene分析类似,这里就不再赘述

基因或者基因集间相关性分析

在计算基因或signature之间相关性时,我们可以利用该工具进行在线绘图。这里的signature按照网址文章的说法,应该是取基因的表达平均值

基因相似性检测

这里可以理解为单基因批量相关性分析,这个分析用处很大。可以通过一个基因和与其相关性高的基因组成一个基因集,来做富集分析,可以反应这个基因可以影响的功能及通路情况。

PCA降维

由于基因数目较多,维度较大,对肿瘤进行可视化比较困难。利用主成分分析(PCA)进行可视化。这里以肝癌的正常和肿瘤为例,选择基因进行降维.


主成分的方差贡献


三维可视化


二维可视化

单基因泛癌分析链接

TCGA单基因免疫相关泛癌分析,懒人福音, 重磅来袭​mp.weixin.qq.com

公众号“生信小课堂”

TCGA数据分析课程:生物信息学教学

好了今天的数据库介绍就到这里了,下回见。

极速赛车1天赚1000方法 生存分析


输入基因名,选择OS还是RFS,设定cutoff比例,以及自定义颜色等,点击add添加感兴趣的癌症类型,点击plot就可以得到最终的生存分析结果

LDHA在肝癌中的OS

还可以看某个肿瘤中生存分析p值最小的前500个基因,如下入:

如果想看多个基因在多个癌症中与生存的关联,可以利用survival map工具,输入基因列表和癌症列表,得到每个癌症中每个基因与生存的显著性p值

Isoform分析

isoform分析与gene分析类似,这里就不再赘述

基因或者基因集间相关性分析

在计算基因或signature之间相关性时,我们可以利用该工具进行在线绘图。这里的signature按照网址文章的说法,应该是取基因的表达平均值

基因相似性检测

这里可以理解为单基因批量相关性分析,这个分析用处很大。可以通过一个基因和与其相关性高的基因组成一个基因集,来做富集分析,可以反应这个基因可以影响的功能及通路情况。

PCA降维

由于基因数目较多,维度较大,对肿瘤进行可视化比较困难。利用主成分分析(PCA)进行可视化。这里以肝癌的正常和肿瘤为例,选择基因进行降维.


主成分的方差贡献


三维可视化


二维可视化

单基因泛癌分析链接

TCGA单基因免疫相关泛癌分析,懒人福音, 重磅来袭​mp.weixin.qq.com

公众号“生信小课堂”

TCGA数据分析课程:生物信息学教学

好了今天的数据库介绍就到这里了,下回见。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。