scRNA-seq 可视化最常用的降维方法是 t 分布随机邻域嵌入(t-SNE)以及UMAP。 t-SNE 降维以全局结构为代价来获取局部相似性,可能夸大细胞群体之间的差异,并忽略这些群体之间的潜在联系。因为 t-SNE 图可能显示不同数值的簇,所以另一个困难是选择其复杂度参数。 UMAP 和弹簧力导向布局算法 ForceAtlas2 可以说是底层...
对于单细胞RNA测序数据,通常需要进行2次降维处理,分别为主成分分析(PCA)降维和t-SNE/UMAP降维,并进行可视化。 PCA PCA是一种数学线性维度算法,它利用正交变换将一系列可能线性相关的变量转换为新的线性不相关的变量,从而利用新的变量在低维上显示数据的特征。PCA已广泛应用于scRNA-seq研究,以克服任何单一特征中的噪...
结果证明,在没有AD病理的情况下,与年龄相关的APOE表达增加,为E4小胶质细胞特有。 图4 a:APOE在整个生命周期内在整个脑组织中的表达;b:UMAP显示APOE在所有细胞类型中的表达;c-e:在可检测水平表达APOE的9954个细胞统计;f:CellChat分析结果,Circos图显示显着的APOE受体相互作用。星形胶质细胞(底部,蓝色)表达大部分AP...
在下面的 UMAP 图中,细胞按每个主成分的 PC 分数着色。 让我们浏览一下排名前 16 的 PC: # Adding cluster label to center of cluster on UMAPumap_label<-FetchData(seurat_integrated,vars=c("ident","UMAP_1","UMAP_2"))%>%group_by(ident)%>%summarise(x=mean(UMAP_1),y=mean(UMAP_2))# P...
UMAP是一种基于图的非线性维度技术,主要类似于t-SNE。它构建数据集的高维图表示,并优化低维图表示,使其在结构上尽可能与原始图相似。 我们首先计算 PCA,然后计算数据的邻域图。 sc.pp.neighbors(adata)sc.tl.umap(adata) sc.pl.umap(adata, color="total_counts") ...
e, UMAP图显示了bcl3和pou2af1基因在B细胞中的表达(上)以及相应的转录因子估计的调控活性的AUC,预测其靶基因的表达调控程度(下)。 f, Heatmap显示转录因子(调控活性)的AUC评分,使用SCENIC进行估计,然后使用thet-test进行两组间的...
snRNA-seq分析得到了8635个细胞核和22,568个基因,每个细胞平均得到2662.6 reads。UMAP显示了24个不同的细胞类群,,其中最多的是内皮细胞(28.8%)、成纤维细胞(25.3%)和心肌细胞(22.8%),它们分别含有约2500个、2200个和2000个细胞核。 图. sn...
越来越多的证据表明t-SNE和UMAP更适合用于scRNA-seq数据,scRNA-seq数据已广泛应用于单细胞分析,用于数据可视化和细胞群识别。然而,t-SNE通常存在一些局限性,例如对于大规模scRNA-seq数据集的计算时间较慢,并且没有保留全局数据结构。UMAP具有上述两方面的优势,成为目前最受欢迎的降维选择。UMAP不仅有助于可视化细胞类...
(A)UMAP图显示癌症髓系细胞的不同簇。(B)髓系细胞中M1极化基因集、M2极化基因集,促炎症基因集和抗炎症基因集的表达得分。(C)不同髓系细胞簇的相应标志物的表达。(D)髓系细胞中代谢活性相关基因集与M1极化基因集、M2极化基因集,促炎症基因集和抗炎症基因集的相关性。(E)免疫丰富型和免疫低下型胃癌、分化型...
该比较中 UMAP 的不同之处在于其扩展至大量细胞的速度和能力 (Becht et al,2018)。因此,在没有特殊生物学问题的情况下,我们将 UMAP 视为探索性数据可视化的最佳实践。而且,UMAP 还可以在两个以上维度汇总数据。虽然我们不知道 UMAP 在数据汇总中的任何应用,但它可能证明是 PCA 的合适替代方法。