假设我有一个样本 {} = {()} 来自概率分布 . 如何使用它来估计 X 和 Y 之间的互信息?
在哪里 和 是 X 和 Y 的边际分布:
.
假设我有一个样本 {} = {()} 来自概率分布 . 如何使用它来估计 X 和 Y 之间的互信息?
在哪里 和 是 X 和 Y 的边际分布:
.
装箱
进行这种估计的一种简单方法是将连续值放入箱中并获得离散问题。拆分域 和 放入箱中并计算落在每个箱内的点数以获得密度。因此,计算将是:
在哪里 是样本数,其中 和 , 是样本数,其中 和 是样本数,其中 .
熵和密度估计
另一种方法是注意互信息可以表示为
因此,如果您可以估计熵,则可以估计信息。现在,为了找到函数对数据的期望,您可以使用插件估算器并执行
这里的问题是我们要估计函数 在哪里 取决于我们的数据。
所以可以使用密度的估计 对于每个点,然后使用插件估计器。核密度估计器是一种方法,最近邻估计器是另一种方法。这两种方法都是非参数的。