UMAP 的核心思想是通过在数据流形结构上建立连通性图,来保留原始数据的局部和全局结构。UMAP 首先使用随机梯度下降法来生成连通性图,然后将图中的节点映射到低维空间中。这个过程中,UMAP 使用了一些新的数学技术,包括 Riemannian geometry、algebraic topology 和 spectral graph theory 等,以提高算法的效率和可扩展性。
选择细胞群进行降维分析 🔍 在workspace下方的plugin中选择UMAP,对需要降维分析的细胞群进行分析。如果数据量较大,分析可能需要一些时间。布局编辑器应用 🖼️ 打开layout editor,将计算好的UMAP复制到编辑器中,并将需要展示的细胞群拖到UMAP图上。细节处理 🔧 通过右击选择properties,对图片及注释表的内容进行细节...
UMAP降维分析 UMAP(Uniform Manifold Approximation and Projection)是一种可伸缩的降维方法,在单细胞基因组学中应用广泛,它能最大程度保留原始数据特征的同时大幅度降低特征维数。相对于t-SNE降维方法,UMAP能弥补t-SNE在高维单细胞分析中容易丢失大规模信息(集群间关系)、计算时间较慢以及无法有效地表示非常大的数据集...
目录第一章 介绍 1.1 安装环境1.2 单细胞RNA测序技术1.3 第一个分析例子第二章 基础 2.2 数据标准化2.3 特征选择2.4 降维之PCA2.4 降维之t-SNE2.4 降维之UMAP2.5 聚类之Louvain2.5 聚类之Leiden2.6 发现Marker基因…
这里用到的降维算法UMAP,它的基本原理是拓扑数据分析。 拓扑数据分析可以用来分析高维数据的拓扑结构。它的想法是,我们收集到的这些离散数据点是高维空间中某个流形上面的采样点。为了得到原来流形的拓扑,我们在每个点处吹起一个小气球,当两个点的小球碰到的时候,就给这两个点连一条边。【下面第一个链接有互动程序...
UMAP UMAP (Uniform Manifold Approximation and Projection) 算法是一种创新的降维流形学习算法。来自于拓扑数据分析。可以用于类似于t-SNE的可视化,但也可以用于一般的非线性降维。文章里的这个图可以看出,sars-cov-2感染患者的血清组学数据与健康个体的组学数据得到了很好的分辨,而其他组则表现出一定程度的分离。
类似2021年CELL 文章Single-cell landscape of the ecosystem in early-relapse hepatocellular carcinoma,单细胞文献的Fig1一般会有细胞类型的全局umap图,分样本 和 分组的umap图 ,以及分样本 和 分组的细胞类型比例柱形图。 本推文介绍一下如何实现,涉及( ...
UMAP 是一个降维算法和强大的数据分析工具。 它在速度方面类似于 PCA(主成分分析),并且类似于 tSNE 来降低维度,同时尽可能多地保留数据集的信息。在 2018 年引入 UMAP 算法之前,PCA 和 tSNE 存在两个最显着的缺陷: PCA 速度非常快,但代价是在缩减后丢失了数据的更精细细节 ...
UMAP ,全称uniform manifold approximation and projection,统一流形逼近与投影,是基于黎曼几何和代数拓扑的理论框架结构构建的。在处理大数据集时,UMAP优势明显,运行速度更快,内存占用小。Etienne Becht等人2019年在Nature Biotechnology上发表一篇文章将其应用在生物学数据上并阐述了UMAP在处理单细胞数据方面的应用和优势。
基本概念:PCA:即主成分分析,是数据降维的方法。从高纬数据中提取数据的特征向量(成分),转换为低维数据并且用二维或者三维的图来展示这些特征。从特征向量中提取最能体现数据特征(差异)的 2 个特征向量(成分)用于可视化,这就是 PCA 图。 UMAP :也是数据降维的一种方法和可视化。在高纬度构建一个图,然后经过优化(...