该案例中所使用的寻找mark基因的方法比较简单直观,采用均值-方差方法:计算基因在不同细胞中表达水平的方差与均值,选取方差与均值比例最大的前N个基因作为mark基因。这依赖一个朴素的统计学常识:在古典概型中,方差与均值的比例越大,意味着数据分布越不平均。这种不平均,在生物学中就被解读为基因的特异性表达。 得到...
但还存在以下两个考虑,使得我们需要思考优化数据的存储方式:首先,从计算效率的角度出发,小鼠细胞其实不参与最后的细胞聚类,只是为人类细胞的数据分析提供一个参照基准,所以小鼠细胞的庞大基因库其实在这个案例中显得有点冗余;其次,从代码简洁的角度出发,前缀的存在也会稍微增加代码逻辑的复杂度。 这个原始数据文件真的非...
和之前的案例一样,我们对每个样本各自进行标准化以消除样本内的技术误差(这个数据集在上传到开源平台前就已经做了质量控制,所以我们不需要额外进行质控): # normalize and identify variable features for each dataset independently ifnb.list <- lapply(X = ifnb.list, FUN = function(x) { x <- NormalizeDa...
在今天的案例中,我们将利用WNN技术,对来自CITE-seq的样本,进行RNA+ADT多模态分析。内容参考Seurat官网的案例: https://satijalab.org/seurat/articles/weighted_nearest_neighbor_analysis.html#wnn-analysis-of-cite-seq-rna-adt-1satijalab.org/seurat/articles/weighted_nearest_neighbor_analysis.html#wnn-analys...
1. 数据加载和预处理 我们首先从SeuratData数据包中把pbmc3k数据集下载到电脑上。这个数据集相信大家并不陌生,通常用于Seurat的教程和演示,我们之前的案例一演示中用的也是该数据集。 SeuratData::InstallData("pbmc3k") 我们需要加载一些必要的 R 包,其中Seurat是单细胞数据分析的核心工具,ggplot2和patchwork用于数据...
Neal:单细胞测序分析:Seurat实操 案例二__多模态分析18 赞同 · 1 评论文章 在今天的案例中,我们将使用来自10x Genomics的、公开可用的约 12000 个人类 PBMC“多组”数据集,来展示如何整合scRNA-seq与scATAC-seq数据并进行分析。该案例参考原文如下: https://satijalab.org/seurat/articles/atacseq_integration_vig...
Neal:单细胞测序分析:Seurat实操 案例5-1__加权最近邻分析(CITE-seq: RNA + ADT)8 赞同 · 0 评论文章 今天这篇文章算是对案例5-1的补充,我们将展示如何在10x Multiome平台上使用WNN方法对RNA+ATAC数据进行多模态分析。因为该案例只是更换了数据集的类型,在宏观的逻辑链条上,与案例5-1没有区别——只是调用...