1️⃣ 目前,大多数scRNA-seq是使用人类或小鼠的组织、器官或细胞培养物进行的。常用的就是UCSC(hg19、hg38、mm10等),和GRC(GRCh37、GRCh38、GRCm38)。 二者在主要染色体上是对等的(如hg38的chr1=GRCh38的chr1),但在一些小的位点上会有细微差异。 基因组注释过程包括定义基因组的转录区域,明确exon和intron...
使用14 个真实 scRNA-seq 数据集和 170 多个额外的模拟数据集比较了这些方法的性能。比较了各种方法恢复模拟和专家注释标记基因的能力、预测性能和所选基因集的特征、内存使用率和速度以及实现质量。此外,还利用各种案例研究对最常用的方法进行了仔细研究,突出了其中存在的问题和不一致之处。结果凸显了简单方法的功效,...
细胞定量是scRNA-seq重要的分析步骤,主要是进行细胞与基因的定量, cell ranger将比对、质控、定量都封装了起来,使用起来也相当便捷。 1. 基本软件安装准备 需要准备cellranger和samtools 软件 cellranger安装和使用参考:生信与基因组学:单细胞RNA测序(scRNA-seq)Cellranger流程入门和数据质控 # 安装samtools, STARconda ...
在这项工作中,作者开发了一种新的两步法来自动标记含有新细胞的scRNA-seq数据。称之为使用基于机器学习的方法对未知细胞的存在进行细胞注释(CAMLU)。在第一步,CAMLU使用自动编码器和迭代特征选择的组合来区分已知细胞类型和新的细胞类型。这样的目的是,用训练数据训练自动编码器后,自动编码器将包含所有已知细胞类型的...
kegg 注释 函数split()可以按照分组因子,把向量,矩阵和数据框进行适当的分组。它的返回值是一个列表,代表分组变量每个水平的观测。 gcSample=split(sce.markers$ENTREZID,sce.markers$cluster)## KEGG xx<-compareCluster(gcSample,fun="enrichKEGG",organism="hsa",pvalueCutoff=0.05)p<-dotplot(xx)p+theme(ax...
5k买的单细胞转录组scRNA-seq代码 全部分享|单细胞转录组scRNA-seq全代码流程。共125G。 生信小优 74 0 当初花6k买的单细胞空间转录组全流程代码,全部分享~空间转录组联合单细胞新思路全流程,包含脚本,分析思路,参数测试,空间多样本整合,多样本整合去批次,细胞网络 生信小优 257 0 终于有人把国自然医学课题申...
Note:如果设置clusters=,则会在cluster层面进行细胞类型的注释;否则是在细胞层面
,并非scRNA-seq数据中的所有零都可以被视为缺失值。在统计中,通常估算缺失的数据值。在此过程中,缺失值将随机或通过适应数据结构替换值,以改进统计推断或建模。由于真零假计数之间的非平凡区别,具有...噪使用模拟和真实数据集改进了一系列典型的scRNA-seq数据分析。 方法1.Noise model 零膨胀的负二项分布(ZINB)...
Cell BLAST是基于深度学习模型的scRNA-seq数据检索和注释的新方法,同时具备高质量注释的scRNA-seq参考数据库ACA,可以有效利用现有数据进行细胞注释和跨数据集研究。 在线访问地址:https://cblast.gao-lab.org/ 类比BLAST,Cell BLAST使用对抗自编码器进行数据降维,利用对抗学习策略来消除数据集间的批次效应,可以在参考数...