# a=fread('TCGA_BRCA/UCSC_xena/TCGA-BRCA.htseq_counts.tsv.gz',data.table=F)a[1:4,1:4]# Ensembl_IDTCGA-3C-AAAU-01ATCGA-3C-AALI-01ATCGA-3C-AALJ-01A #1ENSG00000000003.139.3487288.71424610.356452#2ENSG00000000005.51.5849631.5849635.727920#3ENSG00000000419.1110.87498110.83447110.329796#4ENSG0000000...
a <- fread("TCGA-BRCA.htseq_counts.tsv.gz",sep = '\t',header = T) #读取表达矩阵文件 a <- as.data.frame(a) #转换为数据框,读取后,转换前的a的类型是"data.table" "data.frame" a[1:4,1:4] rownames(a) <- a[,1] a <- a[,-1] #去除第一列,行名修改。 genes <- row....
# 文件BRCA.htseq_counts.tsv.gz从UCSC的XENA数据库下载,大于100M所以不提供在这里。 # a=fread('TCGA_BRCA/UCSC_xena/TCGA-BRCA.htseq_counts.tsv.gz',data.table=F) a[1:4,1:4] # Ensembl_ID TCGA-3C-AAAU-01A TCGA-3C-AALI-01A TCGA-3C-AALJ-01A # 1 ENSG00000000003.13 9.348728 8.714246 ...
phenotype_file <- read.table('TCGA-BRCA.GDC_phenotype.tsv.gz',header = T,sep = '\t',quote = '') ## 检查一下表头,其实Xena上有两个样本信息的文件,选择'TCGA-BRCA.GDC_phenotype.tsv.gz'的原因就在于另一个样本信息文件所包含的内容过少。大家可以下载下来看一下。 (phenotype_colnames <- asN....
SARC.fkpm=fread("TCGA-BRCA.htseq_fpkm.tsv.gz",header = T, sep = '\t',data.table = F)#...
RNA-seq表达矩阵:TCGA-BRCA.htseq_counts.tsv 临床数据:TCGA-BRCA.GDC_phenotype.tsv 突变数据:TCGA.BRCA.mutect.maf.gz AI代码助手复制代码 1.2 数据清洗 去除低表达基因(TPM/FPKM < 1的基因在>50%样本中表达) 标准化处理(推荐DESeq2的vst转换或log2(TPM+1)) ...
a=fread(''TCGA-BRCA.htseq_counts.tsv'',sep = '' '',header = T) a=as.data.frame(a) a[1:4,1:4] rownames(a)=a[,1] a=a[,-1] genes=rownames(a) a[1:4,1:4] ## 在数据的介绍页面上我们已经得知了数据的计算方法现在我们只要把它还原回去就可以了 a=2^a-1 a[1:4,1:4]...
1.https://gdc.xenahubs.net/download/TCGA-LAML/Xena_Matrices/TCGA-LAML.htseq_counts.tsv.gz 2.https://gdc.xenahubs.net/download/TCGA-ACC/Xena_Matrices/TCGA-ACC.htseq_counts.tsv.gz 3.https://gdc.xenahubs.net/download/TCGA-LAML/Xena_Matrices/TCGA-LAML.survival.tsv.gz 4.https://gdc....
https://gdc.xenahubs.net/download/TCGA-LAML/Xena_Matrices/TCGA-LAML.htseq_counts.tsv.gzhttps://gdc.xenahubs.net/download/TCGA-ACC/Xena_Matrices/TCGA-ACC.htseq_counts.tsv.gz 绝大部分文件的下载地址中,网址的规律是: 代码语言:javascript ...
https://gdc.xenahubs.net/download/TCGA-ACC/Xena_Matrices/TCGA-ACC.htseq_counts.tsv.gz https://gdc.xenahubs.net/download/TCGA-LAML/Xena_Matrices/TCGA-LAML.survival.tsv.gz https://gdc.xenahubs.net/download/TCGA-ACC/Xena_Matrices/TCGA-ACC.GDC_phenotype.tsv.gz ...