“熵”粗略地捕捉了概率分布中“信息”的程度。
对于离散分布,有一个更准确的解释:离散随机变量的熵是传输随机变量结果所需的预期位数的下限。
但是对于一个连续的随机变量,有无数个结果,所以我们甚至不能开始转移在有限的比特串中发生了哪个确切的结果。
什么是连续变量熵的等效解释?
“熵”粗略地捕捉了概率分布中“信息”的程度。
对于离散分布,有一个更准确的解释:离散随机变量的熵是传输随机变量结果所需的预期位数的下限。
但是对于一个连续的随机变量,有无数个结果,所以我们甚至不能开始转移在有限的比特串中发生了哪个确切的结果。
什么是连续变量熵的等效解释?
由于离散点的密度有限,解释
因为直接概括导致
直观地说,由于,因此使用较少位来编码更可能发生的事情的推理不成立。所以,我们需要找到另一种解释方式, 选择是分歧。
假设我们有一个均匀分布在同一个状态空间,那么我们有
所以从散度来看,连续分布的熵可以解释为:
如果我们使用均匀分布来编码,那么平均有多少位是不必要的。
您通过概率密度离散化问题。连续随机变量的密度为,它在局部近似于可能的,它现在是离散情况的模拟. 根据微积分理论,您的总和等效地成为您状态空间上的积分。