SingleR把内置的参考细胞标记数据集放在了celldex包,其中包含7个常用的数据集,即5个人类数据集和2个小鼠的数据集,下面就以Human primary cell atlas (HPCA) 参考数据集为例看下如何进行细胞注释。 #提取参考注释数据集; hpca_ref<- HumanPrimaryCellAtlasData 出错原因是无法正常从github下载对应的数据,我们只能利用...
通过“head(pred)”查看自动注释结果。 通过“unique(pred$pruned.labels)”查看自动注释得到的细胞类别。 发现原始Cluster有0~7,8种,自动注释结果只有7种,查看输出的结果文件,发现Cluster0与Cluster2均被识别为同一种细胞类型。故后续需要选择差异基因中高表达基因作为Marker进行手动注释。 自动注释结果查看 基于CellMa...
SingleR是一个用于对单细胞RNA-seq测序(scRNA-seq)数据进行细胞类型自动注释的R包(Aran et al.2019)。依据已知类型标签的细胞样本作为参考数据集,对测试数据集中的细胞进行标记注释。 一 内置数据库 使用SingleR的最简单方法是使用内置参考对细胞进行注释。singleR自带的7个参考数据集,其中5个是人类数据,2个是小鼠的...
目前SingleR内置的数据库有7个,5个人的数据库HumanPrimaryCellAtlasData、BlueprintEncodeData、DatabaseImmuneCellExpressionData、MonacoImmuneData、NovershternHematopoieticData;2个小鼠的数据库ImmGenData、MouseRNAseqData,可应用于相应物种及组织的单细胞结果注释。 图1.SingleR单细胞注释工作原理 代码链接bioconductor.org...
细胞类型注释是单细胞多组学数据分析的核心步骤。常见的细胞类型注释方法是首先进行无监督聚类,然后根据先验知识手动为每个簇分配细胞类型标签。然而,随着被分析的细胞数量呈指数级增长,手动注释方法面临着难以复制且十分耗时的缺点。 另一种更...
在scRNA-seq数据中注释细胞的一般工作流程有三个主要步骤:自动注释、手动注释和验证。首先,自动注释使用预定义的一组“标记基因”(即在已知细胞类型中特异性表达的基因)或参考单细胞数据(现有的专业注释的单细胞图谱),通过将单个细胞或细胞簇的基因表达模式(特征)与已知细胞类型的基因表达方式(特征)相匹配来...
通过“head(pred)”查看自动注释结果。 通过“unique(pred$pruned.labels)”查看自动注释得到的细胞类别。 发现原始Cluster有0~7,8种,自动注释结果只有7种,查看输出的结果文件,发现Cluster0与Cluster2均被识别为同一种细胞类型。故后续需要选择差异基因中高表达基因作为Marker进行手动注释。 自动注释结果查看 基于...
目前SingleR内置的数据库有7个,5个人的数据库HumanPrimaryCellAtlasData、BlueprintEncodeData、DatabaseImmuneCellExpressionData、MonacoImmuneData、NovershternHematopoieticData;2个小鼠的数据库ImmGenData、MouseRNAseqData,可应用于相应物种及组织的单细胞结果注释。
单细胞分析数据后,得到族群后,如何将族群进行细胞名称注释是重要的步骤。这里使用SingleR 进行简单的自动注释。 安装需要的R包 需要两个包SingleR 和celldex...
如果训练数据没有很好地注释或以低分辨率注释,分类器也会做同样的事情。同样,如果训练数据和/或其注释有噪声,分类器可能表现不佳。 自己的数据与训练分类器的数据的相似度。例如,如果分类器是在drop-seq单细胞数据集上进行训练的,并且数据是10X单核而不是单细胞drop-seq,则这可能会降低注释的质量。在包括多种...