TCGA数据下载有很多方式,比如说使用生信人小工具下载,比如说使用R语言下载等等,但是在这里我想说的如何使用TCGA官网下载数据。(在官网下载数据的一大优势在哪里呢?这里我不做过多的解释)
首先,先进入TCGA官网 https://portal.gdc.cancer.gov/
首先下载在官网下载所需要的小工具
根据自己的电脑选择合适的版本,返回上一层,进入Repository,打开后类似于这样的界面
左边就是需要选择的类型
如,我们需要下载mRNA的表达谱数据,HTSeq-Counts是最原始的reads,后期需要进行标准化和归一化处理的
在这里选择肿瘤类型
这里以乳腺癌为例
后面的根据需求自行选择,右边就会出现很多样本
下载三个文件
打开cmd命令行界面
便可以下载成功了,成功后会出现肿瘤样本和正常样本的个数,需要记录下来,整理数据使用的是perl可以先安装perl