1,Xena官网 浏览器中输入网址 http://xena.ucsc.edu/ ,下拉找到Explore TCGA, GDC, and other public cancer genomics resources,点击 2,选择GDC,然后进入TCGA数据队列列表 其他数据集可根据需要自行常看。 3,选择数据集 下拉选择需要的队列,此处以BRCA为例 4,查看数据 点击GDC TCG
也可以直接通过下面链接直达:https://xenabrowser.net/datapages/ 往下拉,就可以看见TCGA的数据集。 我随便选择一个, GDC TCGA Lung Adenocarcinoma (LUAD),我们进去就可以看到各种数据。 比如选择RNASeq是数据 就可以看见数据的详细信息,在download处的链接就可以下载数据了。这里的FPKM数据进行了log2(fpkm+1)转换...
1. 数据集获取 2. 数据处理(Rstudio) 3. 结语 本项目以非小细胞肺癌(non-small cell lung cancer,NSCLC)中的肺腺癌(lung adenocarcinoma,LUAD)作为展示 选用的数据库是TCGA。 物种:人类(Homo sapiens) 实验分组:疾病组,对照组。 我这里使用的R版本是4.2.2 要用到的R包:tidyverse, rtracklayer, dplyr 1....
然后是使用GDCdownload函数可以下载通过GDCquery检索到的数据 最后是使用GDCprepare函数可以整合下载的数据,将其转换成易于分析的格式。 虽然说TCGAbiolinks本身还提供了大量的数据分析函数,主要是各种统计可视化,但是我们拿到了数据后其实就可以自己分析啦。 三个步骤的案例演示 如果我们感兴趣NSCLC的里面的LUAD数据集的somati...
如果我们感兴趣NSCLC的里面的LUAD数据集的somatic的突变信息的maf文件,可以借助TCGAbiolinks包进行TCGA的somatic的突变信息下载整理,代码非常简单, 如下所示: library(TCGAbiolinks) query <- GDCquery( project ="TCGA-LUAD", data.category ="Simple Nucleotide Variation", ...
如果我们感兴趣NSCLC的里面的LUAD数据集的somatic的突变信息的maf文件,可以借助TCGAbiolinks包进行TCGA的somatic的突变信息下载整理,代码非常简单, 如下所示: library(TCGAbiolinks) query <- GDCquery( project ="TCGA-LUAD", data.category ="Simple Nucleotide Variation", ...
在肺癌中非小细胞肺癌(NSCLC)占到其总数的80%~85%[1],NSCLC的病理类型又包括鳞状细胞癌、腺癌、大细胞癌等[2]。肺腺癌是具有腺样分化或黏液分泌的恶性上皮肿瘤,目前已成为最常见的肺癌病理类型[3,4]。多数患者确诊时已出现远处播散转移,各种干预及治疗手段效果差,因此预后较差[5]。
但在肾透明细胞癌相关的研究中涉及ceRNA的较少。本研究中我们基于TCGA数据库,应用R软件等相关技术构建了肾透明细胞癌的ceRNA调控网络并构建了预后模型。最终筛选出3个lncRNAs、6个miRNA和9个mRNA。在3个lncRNA中,曾有研究表明,WT1-AS在NSCLC中过表达通过下调UCA1抑制NSCLC细。 。. .。。
方法 从癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库收集肺腺癌数据集,下载临床信息资料及基因表达谱资料.通过TIMER2.0计算TCGA数据库中免疫相关淋巴细胞浸润情况.并对EGFR突变型与野生型患者进行基因集富集分析.结果 临床特征分析显示EGFR突变更频繁发生于女性以及未吸烟患者中.免疫浸润分析显示EGFR突变患者通常...
发展[3、4]。但在肾透明细胞癌相关的研究中涉及ceRNA的较少。本研究中我们基于TCGA数据库,应用R软件等相关技术构建了肾透明细胞癌的ceRNA调控网络并构建了预后模型。最终筛选出3个lncRNAs、6个miRNA和9个mRNA。在3个lncRNA中,曾有研究表明,WT1-AS在NSCLC中过表达通过下调UCA1抑制NSCLC细 ...