在阅读Laurens van der Maaten 关于 t-SNE 的论文时,我们会遇到以下关于 perplexity 的陈述:
困惑度可以解释为对有效邻居数量的平滑度量。SNE 的性能对 perplexity 的变化相当稳健,典型值在 5 到 50 之间。
这个有效的邻居数量意味着什么?我是否应该将困惑值理解为该点最近邻居的预期数量? 但这意味着在我们的数据集中拥有恒定数量的组,随着观察次数的增加,我们也应该增加 perplexity 值,这似乎完全违反直觉,并且与建议的 5 到 50 之间的值范围不一致。
另一方面,正如这里所指出的,随着 perplexity 的值接近数据集中的点数,我们最终可能会得到一个完全没有聚类的可视化。
因此,我的问题是:困惑是否与集群中的预期点数相关,或者我只是误解了引用的摘录?一般来说,困惑背后的直觉是什么——它可以近似地预期还是设置它的唯一方法是尝试不同的值并直观地评估结果图?