我正在尝试将互信息的概念应用于特征选择,如这些讲义(第 5 页)中所述。
我的平台是matlab。从经验数据计算互信息时,我发现一个问题是数字总是向上偏差。我在 Matlab Central 上发现了大约 3~4 个不同的文件来计算 MI,当我输入独立随机变量时,它们都给出了很大的数字(比如 > 0.4)。
我不是专家,但问题似乎是,如果您简单地使用联合密度和边际密度来计算 MI,则会在此过程中引入偏差,因为 MI 从定义上讲是正数。有人对如何准确估计互信息有实用的建议吗?
一个相关的问题是,在实践中,人们如何实际使用 MI 来选择特征?由于 MI 在理论上是无界的,因此如何得出阈值对我来说并不明显。还是人们只是按 MI 对特征进行排名并获取前 k 个特征?