假设您已经在 MNIST 数字上训练了您的(变分)自动编码器。一段时间后,您检查结果并确定重建非常好。但这是非常主观的。
想象一下,你给编码器一张显示“X”的图片。看看输出,重建应该是非常糟糕的。但同样,这是主观的。
我正在寻找一种客观评估当前图像性能的方法。对于 VAE,训练期间的成本函数是重建误差(在我的例子中为 MSE)和 KL 散度的组合。到目前为止,我为此使用了唯一的重建错误,因为喂食 X 时会急剧上升。
问题是:我在哪里划清“好”和“坏”重建之间的界限,我可以根据哪个客观衡量标准来做这件事?