我想使用朴素(经验)估计器。
是否有一些关于以一定精度执行此操作所需的样本数量的结果,或者等效地,在给定有限数量的样本的情况下计算该值的误差?
我想使用朴素(经验)估计器。
是否有一些关于以一定精度执行此操作所需的样本数量的结果,或者等效地,在给定有限数量的样本的情况下计算该值的误差?
熵估计是一个非常困难的问题。根本问题是您的估计受到“未观察到的”事件的严重影响(尽管这些事件具有非零概率)。
有很多不同的熵估计器专门设计用于解决这个问题。例如,参见Liam Paninski 的 BUB 估计器、Nemenman 等人的NSB估计器、Vu 等人的覆盖调整估计器(另见 Chao 等人,2003)和Archer 等人的PYM 估计器。
还有许多其他论文解决了这个问题。每个都有一些不同的方法,有些可能在不同的情况下更合适。我建议的几篇论文提供了免费的在线代码,可以自动计算估计和置信度。您可能也对此和R 包 'entropy'感兴趣。