我看过一些非统计学家的谈话,他们似乎使用互信息而不是回归(或等效/密切相关的统计测试)来重新发明相关性度量。
我认为统计学家不采用这种方法是有充分理由的。我外行的理解是熵/互信息的估计器往往是有问题的和不稳定的。我认为权力也因此存在问题:他们试图通过声称他们没有使用参数测试框架来解决这个问题。通常这种工作不会影响功率计算,甚至不会影响置信/可信区间。
但是,如果数据集非常大,那么慢收敛有什么大不了的吗?此外,有时这些方法似乎“有效”,因为这些关联已通过后续研究得到验证。对使用互信息作为关联度量的最佳批评是什么?为什么它没有广泛用于统计实践?
编辑:另外,有没有涵盖这些问题的好论文?