这些参考大多来自细胞群体的大规模RNA测序或微阵列数据,这些细胞群体在排序和/或培养后由纯细胞类型组成。目的是为进一步的细胞类型注释或大规模表达数据中细胞类型比例的解卷积提供一种通用资源。 每个数据集都包含一个对数归一化的表达矩阵,该矩阵旨在与常见单细胞方法的log-UMI计数(Aran等人,2019)或来自整体数据集的...
2.参考数据集的获取 SingleR把内置的参考细胞标记数据集放在了celldex包,其中包含7个常用的数据集,即5个人类数据集和2个小鼠的数据集,下面就以Human primary cell atlas (HPCA) 参考数据集为例看下如何进行细胞注释。 #提取参考注释数据集; hpca_ref<- HumanPrimaryCellAtlasData 出错原因是无法正常从github下载对应...
(B)Qian_et_al_Breast 数据集的UMAP可视化,同样根据作者的细胞类型注释进行着色,并与上述三种方法产生的MACE注释进行比较。 (C)箱线图比较了所有方法的性能,基于精确度评分,表明共识方法在9种不同癌症类型中产生了最精确的注释。 共识注释的优势 共识注释方法在所有癌症类型中都表现出了最高的精确度,能够有效减少假...
早期(可能是五六年前)我们的单细胞转录组数据分析教程确实是提到过singleR的方法,它可以依赖于singleR自己的数据库文件去自动化注释单细胞转录组亚群。 但是因为singleR的数据库资源陈旧而且很有限,满足不了日益增长的单细胞应用,后面我们都是主推第一层次降维聚类分群后的人工命名,通常我们拿到了肿瘤相关的单细胞转录组...
第一步:首先,初步确定细胞类型,人工注释需要了解项目的样本类型及病理信息,对不同样本可能有什么样的细胞类型有个初步的了解。比如肝组织中特异存在的库否细胞和肝实质细胞;PBMC中的单核细胞,T细胞,B细胞;心脏组织中的心肌细胞等。其次,人工注释会基于自动化注释的结果,对每个cluster的细胞类型,再次进行检查和检验。
早期(可能是五六年前)我们的单细胞转录组数据分析教程确实是提到过singleR的方法,它可以依赖于singleR自己的数据库文件去自动化注释单细胞转录组亚群。 但是因为singleR的数据库资源陈旧而且很有限,满足不了日益增长的单细胞应用,后面我们都是主推第一层次降维聚类分群后的人工命名,通常我们拿到了肿瘤相关的单细胞转录组...
早期(可能是五六年前)我们的单细胞转录组数据分析教程确实是提到过singleR的方法,它可以依赖于singleR自己的数据库文件去自动化注释单细胞转录组亚群。 但是因为singleR的数据库资源陈旧而且很有限,满足不了日益增长的单细胞应用,后面我们都是主推第一层次降维聚类分群后的人工命名,通常我们拿到了肿瘤相关的单细胞转录组...
//单细胞marker数据库 因为各种各样的原因,自动注释的结果可能不如人意,掌握一些常见细胞类型的经典 marker基因,对于校准自动注释的结果有很大帮助。CellMarker、panglaodb数据库包括人、鼠多个组织的细胞类型marker基因,CancerSEA收集了多个癌种的单细胞数据,提供癌症单细胞功能状态图谱,及相关的基因。
总体而言,当前版本的ScType数据库包括17个人体组织中194种细胞类型的3,980个细胞标记物和17个小鼠组织中194种细胞类型的4,212个细胞标记。 先跑下范例数据 ###ScType 示范数据集--- #Quick start # load libraries and functions #加载三个包 #install.packages...
在单细胞分析中,细胞注释是关键且耗时的任务。目前,我们可以通过多种数据库和自动化工具来简化这个过程。以下是几种常用的数据库资源,包括CellMarker、MCA、HCL、SingleCellBase、Cellxgene Data Portal以及专门针对植物的PlantscRNAdb和PlantCellMarker。在自动化注释软件方面,singleR、sc-type和scMayoMap...