首页 > 编程知识 正文

tcga临床数据解读,TCGA数据处理

时间:2023-05-03 22:41:56 阅读:205483 作者:4331

TCGA临床数据的整理是一个基本的操作

我们选择临床数据在Data category 中选择clinical 最重要的在Data format 中一定要选择XML的]格式
选择自己研究的TCGA肿瘤类型,添加到cart里面下载数据

点击download 下载 cart的内容 保存你们自己喜欢的位置。下面一步是个小技巧 ,使用Windows 的小伙伴
在右侧工具栏搜索XML格式 会把每个文件夹内的XML文件显示出来,最后复制的一个文件夹内最后整理完之后我们导入到RStudio

library("XML")library("methods")setwd("H:/gdc-client_v1.4.0_Windows_x64/1")##设置工作路径dir="H:/gdc-client_v1.4.0_Windows_x64/1" all_fiels=list.files(path = dir ,pattern='*.xml$',recursive=T)##导入文件cl = lapply(all_fiels, function(x){ result <- xmlParse(file = file.path(dir,x)) rootnode <- xmlRoot(result) xmldataframe <- xmlToDataFrame( rootnode[2] ) return(t(xmldataframe)) })clinical <- t(do.call(cbind,cl))write.table(clinical,file="clinical.txt",sep="t",quote=F,row.names = F)

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。