试图理解 Karl Friston 神经科学文章中的自由能方程

数据挖掘 神经网络
2021-09-14 20:58:47

我正在尝试理解一篇神经科学文章:

  • 弗里斯顿,卡尔 J.,等人。“行动和行为:自由能公式。” 生物控制论102.3 (2010): 227-260。( DOI 10.1007/s00422-010-0364-z )

在这篇文章中,弗里斯顿给出了三个方程,据我所知,它们是等价的或可相互转换的,并且指的是物理熵和香农熵。它们在文章的第 231 页上显示为等式 (5):

得到的自由能表达式可以用三种方式表示(使用贝叶斯规则和简单的重新排列):

• 能量减去熵

• 分歧加惊喜

• 复杂性减去准确性

在数学上,这些对应于:

\begin {对齐} F &= - \langle \ln p(\tilde s, \Psi \vert m) \rangle _q + \langle \ln q(\Psi \vert \mu) \rangle _q \ &= D( q(\Psi \vert \mu) \parallel p(\Psi \vert \tilde s, m)) - \ln p(\tilde s \vert m) & \qquad \qquad & (5) \ &= D( q(\Psi \vert \mu) \parallel p(\Psi \vert m)) - \langle \ln p(\tilde s \vert \Psi, m) \rangle _q \end{aligned}

我在这一点上挣扎的事情是:

  1. || 的含义 在方程的第 2 版和第 3 版中;
  2. 和负对数。

任何有助于理解这些方程实际上是 Fristen 声称它们是什么的,我们将不胜感激。例如,在第一个方程中,第一项能量等在什么意义上?

1个回答

我没有资格理解几乎所有那篇论文,但是,我可能能够从信息论中给出一些直觉来帮助你解析这篇论文。

||表示Kullback-Leibler 散度它测量两个分布之间的信息增益。我想你可以说它表明了模型无法捕获的数据真实分布中的信息。

当您看到“负对数”时,请考虑“熵”

在第一个等式中,将其视为“-ln(...) - -ln(...)”。这可能有助于将其视为熵的差异。同样在第二个中,将其读作“D(...) + -ln(...)”。这可能有助于将其视为“加熵”。

如果查看散度定义,您会看到它被定义为 PDF 比率的对数。这可能有助于将其连接到日志和负日志。查看将其写为交叉熵减去熵的定义。那么这都是事物熵差异的问题,可能更清楚。