t-SNE是一种非线性降维算法,其横纵坐标的计算依赖于高维空间中样本点之间的相似度和低维空间中样本点之间的距离。具体来说,在t-SNE算法中,首先通过高斯核函数计算出每个样本点与其它样本点之间的相似度。然后,通过随机初始化的方法在低维空间中生成初始位置,并计算低维空间中样本点之间的欧式距离。接着,利用相对熵(
之所以用这个函数来作为映射后的相似度度量指标,主要是因为对于同一对样本,两个样本比较接近时, S,S′ 会比较接近,而当两个样本比较大时,S,S′的值差距会被放大,在两者的关系画出来如下,横坐标就是相似度取值,纵坐标表示任意两对样本: 有了映射前后的数据分布后,我们就可以通过最小化两个分布之间的差异,使得...