假设我有一个数据集,我在该数据集上训练了一个基本的变分自动编码器 (VAE)(几个由非线性分隔的全连接层)。VAE 的潜在空间是否具有和的特征坐标(它们不是数据集的一部分)?
VAE的潜在空间
数据挖掘
机器学习
2022-02-21 01:48:44
1个回答
这取决于。令为数据的域,即。是来自的样本,遵循某个分布。VAE 的重点是对数据的这种分布进行建模,以便我们可以从中采样。的某些部分将被很好地建模(其中有很多训练示例),而其他部分则很差。
所以问题是或的密度不是太低)值。当然,由于在您的情况下看起来,因此 VAE 对这些值进行编码或解码不会有问题;问题在于潜在编码是否有用或合理。它们不一定要在数据集中,但不能离它太远。(这个问题区域通常称为域适应)。换句话说,它将具有作为无界向量空间的“特征坐标” ,但它们是否有用还是明智的取决于情况。
例如,假设是自然图像,而您所有的都是向日葵的图像。您可以按像素方式的编码不太可能具有合理的潜在表示。但是,如果类似于来自单词模型的嵌入,那么它可能就可以了。
)上评估 VAE 的重建性能通常是一个好主意。所以,我会问自己:是否可以被合理地视为测试集的一部分?如果是这样,那么是的,潜在嵌入也可能没问题。
其它你可能感兴趣的问题