我正在尝试实现一个变分自动编码器(如第 3.1 节所示:https ://arxiv.org/pdf/2004.06271.pdf )。
它与传统的 VAE 不同,因为它将输入图像编码为3 维潜在特征图。换句话说,潜在特征图具有宽度、高度和通道维度,而不仅仅是像传统 VAE 那样的通道维度。
在计算作为损失函数的一部分的 Kullback-Liebler 散度时,我需要作为编码器输出的均值和协方差。但是,如果潜在特征图是三维的,这意味着编码器的输出是三维的,因此每个潜在特征都是一个二维矩阵。
如何从 2D 矩阵导出均值和协方差来计算 KL 散度?