计算神经网络的熵

数据挖掘 机器学习 深度学习 信息论
2021-09-15 06:36:59

我正在寻找计算神经网络中包含的信息。我还希望计算任何神经网络以一定数量的位数包含的最大信息。这两个度量值应该是可比较的(因为我可以比较我当前的神经网络是达到最大值还是小于最大值以及达到了多少)。

信息是相对的,因此我将其定义为相对于神经网络试图估计的数据的真实先验分布。

我遇到了可以应用于矩阵的冯诺依曼熵,但是因为它不是加法的,所以我不能将它应用于一系列权重矩阵(假设权重矩阵编码了神经网络的所有信息)。

我发现了另外三篇论文Entropy-Constrained raining of Deep Neural NetworksEntropy and inter information in models of deep neural networksDeep Learning and the Information Bottleneck Principle第二个包含指向 github 存储库的链接,但此方法需要知道激活函数和权重矩阵,这不是在 n 位中找到任何神经网络的最大熵的情况。

如何计算神经网络中包含的信息量/熵?以及如何为任何 n 位神经网络计算相同的度量?

1个回答

首先,请参阅David JC MacKay 的信息理论、推理和学习算法,从第 40 章开始,了解单个神经元的信息容量(每个权重 2 位),直到至少第 42 章了解 Hopfield 网络(完全连接的反馈)。霍普菲尔德网络信息的经典参考是阿布-穆斯塔法和圣雅克的霍普菲尔德模型的信息容量,但教科书应该足够了。