很多文章对于TCGA中的一些癌症都是联合分析的,比如TCGA-COAD和TCGA-READ,首先是它们的疾病特点和治疗方式存在很多相似之处,同时这样做也可以增大样本量。 如果你是使用TCGAbiolinks包下载的数据,那么它们的合并超级简单,直接cbind()即可! 加载数据和R包 数据都是之前下载好的,可以参考之前的推文: 新版TCGAbiolinks包学习...
GDCprepare(query,save = T,save.filename = "tcga_read.rdata") Error in GDCprepare(query, save = T, save.filename = "tcga_read.rdata") : I couldn't find all the files from the query. Please check if the directory parameter is right or `GDCdownload` downloaded the samples. 看这个报...
DESeq2差异分析 数据整理完成后,一般我们会获得一个原始 read count表达矩阵,其中行是基因,列是样品。常用的差异分析工具包括limma,edgeR,DESeq2。小图就以R包DESeq2的差异表达基因分析方法为例做个简单演示,因为小图今天下载的是count数据。 简单地说,DESeq2将对原始reads count进行建模,使用标准化因子(scale fa...
read_clin <- GDCquery_clinic(project = "TCGA-READ", type = "Clinical") use_cols <- c("bcr_patient_barcode", "disease","gender","vital_status","race") clinical <- coad_clin %>% dplyr::select(use_cols) %>% add_row(dplyr::select(read_clin, use_cols)) %>% subset(bcr_patient...
MESO mesothelioma 间皮瘤 OV ovarian serous cystadenocarcinoma 卵巢浆液性囊腺癌 PAAD pancreatic adenocarcinoma 胰腺癌 PCPG pheochromocytoma & paraganglioma 嗜铬细胞瘤和副神经节瘤 PRAD prostate adenocarcinoma 前列腺癌 READ rectum adenocarcinoma 直肠腺癌 ...
下面就直接用read.maf()函数读取即可,没有任何花里胡哨的操作! 代码语言:javascript 代码运行次数:0 运行 AI代码解释 maf<-read.maf(maf.coad)##-Validating ##-Silent variants:63597##-Summarizing ##--Mutiple centers found ##BCM;WUGSC;BCM;WUGSC;BCM;BI--PossibleFLAGSamong top ten genes:##TTN##SY...
fpkm<-read.table("TCGA-LAML.htseq_counts.tsv",sep="\t",header=T,#row.names="Ensembl_ID",stringsAsFactors=FALSE,check.names=FALSE)fpkm[1:4,1:4] 一些常用参数选项: header:逻辑值,表示文件的第一行是否包含变量的标题; sep:表示在同一行内,用于分割变量值的分隔符; ...
limma和edgeR结果的相关性比较library(ggplot2) DEGs_limma <- read.csv("DEGsBRCA_limma_091018.csv", row.names = 1) DEGs_edgeR <- read.csv("DEGsBRCA_edgeR_091018.csv", row.names = 1) genes_toTest <- rownames(DEGs_limma)[1:1000] genes_common <- intersect(genes_toTest, rownames(...
具有代表性的cis和trans肿瘤的read文件如图2B所示。在这35例双等位基因TP53突变紧密相关突变的肿瘤中,28例(80%)为trans, 7例(20%)为cis(图2C)。进一步对拷贝数状态进行评估,发现7个cis肿瘤中6个出现TP53拷贝数缺失,28例trans肿瘤中27个出现TP5...
metadata <- jsonlite::read_json(path, simplifyVector =T) metadata <- tibble::tibble( file_name = metadata$file_name, md5sum = metadata$md5sum, TCGA_id_full = bind_rows(metadata$associated_entities)$entity_submitter_id, TCGA_id = stringr::st...