你也可以⾃⼰尝试,就是选第⼆个实验,“Two clusters with equal numbers of points.”,然后我⾃⼰参数point per cluster是20,然后perplexity选了40。最后⽆法收敛。所以你⼤概也能猜来这个参数到底应该选什么了,⽂章⾥也说了,应该要⽐point per cluster⼩。⽂章⾥也讨论了t-sne的其他...
perplexity的原本定义是“expected density”,也就是说预估每个cluster可能有多少个元素,有点类似dbscan里的min_sample。 这里有一个可以玩的网站,试试t-sne在不同的参数下跑的结果怎么样。 https://distill.pub/2016/misread-tsne/ 作者自己做了实验,每个cluster有50个点的情况下,看不同的perplexity会有什么结果。