下面我们简单介绍一下转录组数据分析中必不可少的差异基因分析,以及通路富集分析 1. 数据准备 我们来分析 LGG 和GBM 之间的转录组差异,首先从 GDC 中获取原位癌 read count 数据 get_count <- function(cancer) { query <- GDCquery( project = cancer, data.category = "Gene ex
由于我们识别出的位点较少,发现模体的可能性较低,为了让我们能够继续下面的步骤,只能换两种癌型再试试了 我们使用GBM和LGG两种癌型各十个样本,运行上述代码,首先从DNA甲基化均值可以看出这两种癌型的差异具有显著性 而从下面的火山图我们也可以看出差异位点明显增加了很多 从这些差异甲基化位点来寻找模体,看来是很有...
[5]"TCGA-CHOL""TCGA-COAD""TCGA-DLBC""TCGA-ESCA" [9]"TCGA-GBM""TCGA-HNSC""TCGA-KICH""TCGA-KIRC" [13]"TCGA-KIRP""TCGA-LAML""TCGA-LGG""TCGA-LIHC" [17]"TCGA-LUAD""TCGA-LUSC""TCGA-MESO""TCGA-OV" [21]"TCGA-PAAD""TCGA-PCPG""TCGA-PRAD""TCGA-READ" [25]"TCGA-SARC""TCGA-...
在经过 UCSC 处理 GTEx 中,Brain 分为 13 个组织 1148 个样本,但 GEPIA2 将他们分成了由 207+945=1152 两组,那么哪些是可以作为 LGG 或 GBM 的对照的呢? 从TCGA 中下载 LGG 的临床数据,可得都来源于额叶、顶叶、颞叶和枕叶四个脑叶,也就是说都来源于大脑 (Cerebrum), 因此我们要找的也是 Cerebrum. GT...
步骤:1、查找数据:下载TCGA中GBM的RNA-seq和甲基化数据 2、甲基化数据分析,正常肿瘤对比,进行差异甲基化分析,找出肿瘤样本中高甲基化区域 3、对RNA-seq数据进行分析,正常肿瘤对比,差异表达基因的筛选,找出肿瘤样本中低表达基因。 4、结合甲基化和RNA-seq数据,将高甲基化和低表达基因取交集,这些基因很可能属于抑癌...
1、基因芯片数据分析筛选胶质瘤差异基因。 2、TCGA数据库分析显示SAMSN1是GBM生存的危险因素。 3、大样本组织微阵列(TMA)分析SAMSN1在胶质瘤组织中的表达。 4、SAMSN1与TMA样本中胶质瘤疾病等级的关联。 5、SAMSN1与TMA中样本其它临床特征的关联分析。
此外,作者对5000个变化最大的剪切事件或者基因表达数据进行聚类分析,探究每种肿瘤类型间的相似性。 在基因表达与可变剪切间发现一些相似之处:比如,GBM(多形成性胶质细胞瘤)、LGG(脑低级别胶质瘤)与PCPG(嗜铬细胞瘤和副神经节瘤)聚类在一...
TCGA计划对数千个肿瘤样本进行了多组学分析,包括基因突变、拷贝数变异、mRNA表达、DNA甲基化等,揭示了同一癌症类型内部存在着不同的分子亚型。这些亚型往往具有独特的生物学特征,并可能对不同的治疗方法表现出不同的敏感性。TCGA计划的成功为我们深...
分析内容 1、差异表达分析 我们通过利用limma包中的voom算法对每种癌症类型中差异表达的表观遗传调控因子进行鉴定,统计显著的表观遗传调控因子被定义为倍数变化大于或等于2倍,假阳性发现率(FDR)小于0.05。以肝癌为例,我们用上述的方法分析了493个表观遗传调控因子在369例肝癌样本与50例癌旁组织样本之间的表达水平,发...
使用Affymetrix SNP 6.0芯片来分析CNV, 首先使用DNACopy这个R包来计算拷贝数,然后用GISTIC2根据CNV来评估基因的变化情况,是loss还是gain, 流程示意如下 5. Methylation Liftover Pipeline 通过illumina Infinum Human Methylation 27和HumanMethylation450 两个芯片平台来分析DNA甲基化,采用了beta值的定量策略。同时考虑到这...