Protein由蛋白质芯片测序得到的200多种癌症的相关蛋白的表达量。 Methylation由甲基化芯片测序得到的DNA甲基化程度 一、Clinical数据 TCGA临床数据有两种: XML数据:包含的信息最全,包括啊辐射、药品信息、跟进、biospecimen等等信息。 indexed data:只包含最终的状态信息。例如:病人第一状态是alive的,接下来第二状态dead,...
使用GDCprepare处理数据后,会返回SummarizedExperiment或data.frame对象,主要包含三个主要的矩阵,可以使用SummarizedExperiment包来获取对应的信息: 样本信息矩阵,使用colData(data)来获取样本信息 检测矩阵信息,使用assay(data)来获取分子数据 特征矩阵信息,使用rowRanges(data)来获取特征元数据信息,如基因的信息 参数列表 1. ...
(x){x[2]}) COUNT_Ensembl_matrix <- data.frame() for (i in 1:length(count_file_name)){ path <- paste0('gdc_download_20240118_124100.585383//',count_file[i]) data0 <- read.table(path,fill = TRUE,header = TRUE) data <-data0[-c(1:4),c(1,4)] #取出unstranded列得到COUNT...
3.3 将读取的注释文件制成数据框 gtf_df <- as.data.frame(gtf1)#View(gtf_df) 3.4 选取gene_name,gene_id,gene_biotype geneid_df<-dplyr::select(gtf_df,c(gene_name,gene_id,gene_biotype))#View(geneid_df[1:20,3])#sort(table(geneid_df$gene_biotype))#不需要也可以#源代码在https://ww...
第一个是HPRD:human protein reference database 可以查看CDK2的互作蛋白: 以及修饰等: 第二个是Genecards:看我们公众号的同学肯定都知道这个数据库了,收录是关于基因的综合信息: 我们就不多说了,有困难看这篇文章:听说你开题缺素材……。 第三个是Targetscan,做miRNA研究的基本都听过这个工具,这里对应的是调控CD...
TCGA是一个综合性的多组学肿瘤基因组数据库,除包含DNA测序之外,还包含了RNA测序、拷贝数、蛋白谱、甲基化等多个组学的数据,但是在TCGA的官方网站GDC Data Portal (https://portal.gdc.cancer.gov/) 仅有的几个功能模块中,却并没有发现可用的数据挖掘功能,在Analysis模块中也仅有可怜的两项功能:交集分析和队列比...
Protein Data Bank(PDB):PDB是一个国际性的数据库,专门收集和分发关于生物大分子(主要是蛋白质)的三维结构数据。自1971年成立以来,PDB已经成为全球最权威的蛋白质结构数据存储和分享平台。 PDB收录了超过18万个蛋白质结构数据,这些数据来自于X射线晶体学、核磁共振(NMR)和冷冻电镜等多种实验技术。PDB不仅提供了蛋白...
levels=c('Stage I','Stage II',"Stage III","Stage IV"))p <- ggboxplot(filter(Stagedata,Cancer=='LIHC'), x = "Stage", y = "SPP1", fill = "Stage",legend=F,bxp.errorbar=T)+ theme(legend.position='none')+ ylab(label = 'SPP1 expression')p 加上P值 my_comparisons...
Protein Data Bank(PDB):PDB是一个国际性的数据库,专门收集和分发关于生物大分子(主要是蛋白质)的三维结构数据。自1971年成立以来,PDB已经成为全球最权威的蛋白质结构数据存储和分享平台。 PDB收录了超过18万个蛋白质结构数据,这些数据来...
data.type ="Gene expression quantification", platform ="Illumina HiSeq", file.type ="normalized_results", experimental.strategy ="RNA-Seq", barcode = c("TCGA-14-0736-02A-01R-2005-01","TCGA-06-0211-02A-02R-2005-01"), legacy =TRUE ...