TCGA是一个综合性的多组学肿瘤基因组数据库,除包含DNA测序之外,还包含了RNA测序、拷贝数、蛋白谱、甲基化等多个组学的数据,但是在TCGA的官方网站GDC Data Portal (https://portal.gdc.cancer.gov/) 仅有的几个功能模块中,却并没有发现可用的数据挖掘功能,在Analysis模块中也仅有可怜的两项功能
首先你要到这个网址:https://portal.gdc.cancer.gov/,进入下面这个界面,如果你打不开这个页面,那你的下载大概率也会有问题的,因为这个对网络有要求! 打开这个页面后,你需要选择你想要下载的东西,这个数据库下载东西逻辑是很清晰的,比如你想要下载TCGA的直肠癌的常规转录组的mRNA数据,首先你要点击Repository,下面箭头...
工具的下载原理是利用GDC API,感兴趣的可以去看一看。 这是一个极简的下载工具,从盒子打开之后(打不开的看这里),他长这个样子: 对,就是这样,看着啥都没有!!! 其实他是在检索,大约过一会儿(因你的网络而定)就会长这个样子: 左侧就是检索出来可以下载的TCGA的三十多种肿瘤,你可以双击任何的一个肿瘤便可以进...
我GDC下载的文件格式是.augmented_star_gen,所以用file_sample$file_name <- sapply(strsplit(file_sample$file_name,split='e_counts.tsv'),function(x){x[1]})进行切割以和我的文件名匹配。 有的人GDC下载的文件格式是.augmented_star_gene_counts,所以用file_sample$file_name <- sapply(strsplit(file_...
缺点:如果网速慢,你往往面临网页打不开,下载慢等问题 三.在其TCGA网页上直接下载 输入选择条件,点击加入购物车,然后一起下载。 优点:简介方便,有点类似淘宝购物缺点:此方法一般用于少量样本的下载,因为不能下载过大的数据,而且点那么多次购物车也很累啊! 四.通过TCGA官方网站提供的GDC下载工具下载 安装一个软件,...
TCGA是一个综合性的多组学肿瘤基因组数据库,除包含DNA测序之外,还包含了RNA测序、拷贝数、蛋白谱、甲基化等多个组学的数据,但是在TCGA的官方网站GDC Data Portal (https://portal.gdc.cancer.gov/) 仅有的几个功能模块中,却并没有发现可用的数据挖掘功能,在Analysis模块中也仅有可怜的两项功能:交集分析和队列比...
这里要先得到的是每个exon的长度,为了求长度,我们先要有基因组注释文件,你可以在这里下载:https://gdc.cancer.gov/about-data/data-harmonization-and-generation/gdc-reference-files。这是GDC官网里的下载网址,进去以后,选择这个: 下载后解压,这个过程就不赘述了。
首先你要到这个网址:portal.gdc.cancer.gov/,进入下面这个界面,如果你打不开这个页面,那你的下载大概率也会有问题的,因为这个对网络有要求! 打开这个页面后,你需要选择你想要下载的东西,这个数据库下载东西逻辑是很清晰的,比如你想要下载TCGA的直肠癌的常规转录组的mRNA数据,首先你要点击Repository,下面箭头指的两个...
首先你要到这个网址:https://portal.gdc.cancer.gov/,进入下面这个界面,如果你打不开这个页面,那你的下载大概率也会有问题的,因为这个对网络有要求! 打开这个页面后,你需要选择你想要下载的东西,这个数据库下载东西逻辑是很清晰的,比如你想要下载TCGA的直肠癌的常规转录组的mRNA数据,首先你要点击Repository,下面箭头...
TCGA是一个综合性的多组学肿瘤基因组数据库,除包含DNA测序之外,还包含了RNA测序、拷贝数、蛋白谱、甲基化等多个组学的数据,但是在TCGA的官方网站GDC Data Portal (https://portal.gdc.cancer.gov/) 仅有的几个功能模块中,却并没有发现可用的数据挖掘功能,在Analysis模块中也仅有可怜的两项功能:交集分析和队列比...