本文将从机器学习中的数据预处理的视角来介绍PCA、TSNE和UMAP这三个常见的降维方法以及它们之间的区别。1. PCA(主成分分析)PCA是一种常用的线性降维方法,它通过线性变换将高维数据压缩到低维空间中。PCA的核心思想是将原始数据映射到一个新的低维空间中,使得新的变量之间的协方差为0,即去除原始数据之间的冗余...
那么它们有什么区别呢?首先,在高维空间内,描述两个点(两个细胞)的距离不一样,tSNE采取的是“概率算法”,即把两个点的距离转换成概率,若 i 与 j 这两个点距离比较近的话,它所对应的概率较大;而UMAP采取的是传统的欧式距离。这里的x表示的高维空间的距离 在计算σ的时候(计算距离所需)...
首先,在高维空间内,描述两个点的距离算法不一样——tSNE通过正态分布将高维距离数据转换成概率,若两个点距离比较近的话,它所对应的概率较大;而UMAP使用的计算方法有很多,除了传统的欧式距离(即该n维空间中两个点间的真实距离)外,邻近KNN算法、皮尔森相似性、cosin相似性(R包seurat默认方法)都可以。总之来说,只要...
从图中可以看出,UMAP和tSNE都可以较好地把不同类别的细胞分开。但tSNE倾向于把相同细胞群划分为更多的群,如图显示,黑色圈中CD8 T细胞,在tSNE结果中,群数更多,距离更远。 UMAP参数 最重要的参数是 n_neighbors ,近似最近邻居数。它有效地控制了UMAP局部结构与全局结构的平衡,数据较小时,UMAP会更加关注局部结构,数据...
图二(A) UMAP图显示了IgG1显性BMPC成熟的预测路径。箭头表示成熟的方向。(B) UMAP图显示了位于每个成熟路径中的细胞簇,并通过预测的假时间进行着色。(上)每个实心黑点代表一个细胞... +4 分享回复赞 实验吧 科研资料帮 文献解析之通过单细胞分析了解人骨髓浆细胞成熟和存活途径的异质轨迹和标志性途径富集分析以...
首先,在高维空间内,描述两个点(两个细胞)的距离不一样,tSNE采取的是“概率算法”,即把两个点的距离转换成概率,若 i 与 j 这两个点距离比较近的话,它所对应的概率较大;而UMAP采取的是传统的欧式距离。 这里的x表示的高维空间的距离 计算出距离以后,tSNE对距离进行了标准化,而UMAP没有 ...
首先,在高维空间内,描述两个点(两个细胞)的距离不一样,tSNE采取的是“概率算法”,即把两个点的距离转换成概率,若 i 与 j 这两个点距离比较近的话,它所对应的概率较大;而UMAP采取的是传统的欧式距离。 这里的x表示的高维空间的距离 计算出距离以后,tSNE对距离进行了标准化,而UMAP没有 ...