在免疫细胞浸润分析中,我们可以使用ssGSEA来估计每个样本中不同免疫细胞类型的相对丰度。 具体而言,ssGSEA首先将所有基因按照其表达量从大到小进行排序,并计算在某个基因集内,基因表达量较高的基因的累积分布函数。这个累积分布函数被称为基因集富集得分(gene set enrichment score,GSE)。然后,对于每个样本,
单样本基因集富集分析(single sample gene set enrichment analysis, ssGSEA),原理上与GSEA类似,不同的是不同于以组别为单位的GSEA分析,ssGSEA将样本内基因表达谱进行归一化处理,然后计算每个基因集对应的ssGSEA得分。通过这种方式,ssGSEA将单个样本的基因表达谱转换为基因集富集得分矩阵。因此,如果使用的是免疫细胞mar...
进行ssGSEA,我们需要的输入数据有基因表达矩阵和肿瘤浸润免疫细胞基因集。 1.导入基因表达矩阵 load("基因表达矩阵.rdata") View(data) 图1 行为基因、列为样本(注意是matrix,不是data.frame) 2.导入肿瘤浸润免疫细胞基因集 文献中比较常见的用来做肿瘤浸润免疫细胞分析的基因集主要用两个:一个是来源于文献Classif...
ssGSEA分析通常涉及以下几个方面: 1. 方法原理,ssGSEA基于基因表达数据和预定义的基因集(例如基因通路、生物过程等)进行计算,通过将基因表达谱转化为基因集富集得分,从而比较不同样本之间基因集的富集程度。该方法可以帮助我们发现与特定生物学过程或疾病状态相关的基因集富集情况。 2. 应用领域,ssGSEA广泛应用于生物...
总结来说,SSGSEA是一种用于评估单个样本中基因集富集程度的方法。它通过将每个基因在样本中的表达值标准化,并计算基因集的累积求和得分来得出富集分数。SSGSEA在研究中具有广泛的应用价值,可以帮助研究人员了解不同生物学条件下基因集的功能差异,包括疾病和实验条件等。
Table1. ORA、GSEA、ssGSEA比较 过代表分析 过代表分析(Over-Representation Analysis, ORA)是在一组显著表达的基因或代谢物中,推断出在该数据集中受干扰的生物途径或过程,以及在该途径或过程中起作用的基因或代谢物。这里的生物途径或过程可以是多种,例如Gene Ontology(GO) 描述的功能(biological function),KEGG或...
ssGSEA是GSVA的一种特殊类型,二者没有本质上的区别,除了这两种,还有zscore和plage方法,都是通过GSVA包实现的。 我们使用TCGA-SKCM的数据进行演示,注释基因集一般是从misigdb网站下载的,根据你自己的需求来,有些人想看看免疫相关的,那你就下载免疫相关的基因集,你想看炎症相关的就下载炎症相关的基因集。 准备基因...
下面是对ssGSEA的简要解释: 1.基因集:ssGSEA分析的核心是预定义的基因集合,通常是一系列与特定生物学通路、功能、细胞类型等相关的基因。这些基因集可以来自公共数据库(如MSigDB)或根据特定研究的需求定制。 2.分数计算:对于给定的单个样本,ssGSEA会计算每个预定义基因集内基因的表达值的积分。这个积分的计算可以涉及...
SSGSEA的计算公式如下: 1.计算每个基因集的基因表达分数(Gene Set Enrichment Score,GSEA_score): 首先,将基因表达矩阵进行标准化处理,使得每个基因的表达值均呈现标准正态分布。然后,计算每个基因集中的基因的平均表达值(gene_mean)和标准差(gene_std)。 对于每一个样本,根据以下公式计算出每个基因集的基因表达分数...
GO、KEGG、GSEA与ssGSEA的主要区别及适用场景如下:1. GO分析: 定义:基因本体论分析,研究基因的分子功能、细胞组分与参与的生物过程。 特点:不依赖于基因表达量,主要关注差异分析得到的DEG。 适用场景:初步判断处理组与对照组中哪些通路发生了显著性变化。2. KEGG: 全称:京都基因与基因组百科全书...