β-VAE 文章中有一个很好的图,显示了潜在空间代码的质量:

是否有一种通用的方法来可视化或分析潜在空间代码维度,以便在它们过于纠缠或混乱时清楚?
升级版:
该数据集由呈现在黑色画布上不同位置的高斯斑点组成。顶行:原始图像。第二行:相应的重建。剩余行:潜在遍历按其与先验的平均 KL 散度排序(从高到低)。为了生成遍历,我们通过从种子图像(左侧数据样本)推断潜在表示来初始化它,然后遍历单个潜在维度(在 [-3, 3] 中),同时保持剩余的潜在维度固定,并绘制结果重建。热图显示每个潜在单元的 2D 位置调整,对应于给定 blob 的每个可能 2D 位置的每个潜在单元的推断平均值(蓝色峰值,-3;白色,0;红色峰值,3)。
这意味着要生成这样的热图,应该能够在知道 blob 位置的同时平滑地移动 blob。所以实际上应该知道什么是最好的潜在编码。而情节实际上是与这种最佳潜在编码的比较。
当我不知道什么是最好的潜在代码时,我很好奇是否有一种方法可以测量或绘制有助于理解潜在代码质量的“某些东西” 。