如果我了解你有什么可用的信息,你想要什么是不可能的:你可用的信息不足以确定熵。仅仅近似熵是不够的。
听起来你有办法从分布中取样p ( ⋅ ), 你有办法计算比率p (一个1) / p (一个2)对于任何一对元素一个1,一个2您通过采样获得的,但您没有其他信息。如果是这样,你的问题是无法解决的。
特别是,我们可以找到一对具有不同熵的分布,但使用您可用的信息无法区分它们。首先考虑一组(随机)大小的均匀分布2200. 接下来考虑一组(随机)大小的均匀分布2300. 它们具有不同的熵(200 位与 300 位)。但是,鉴于您可以获得的信息,您无法知道您正在使用这两个发行版中的哪一个。特别是,在这两种情况下,比率p (一个1) / p (一个2)将始终恰好为 1,因此这些比率无法帮助您区分两种分布。而且由于生日悖论,您可以随心所欲地采样,但是您永远不会两次获得相同的值(不是在您的一生中,除非是指数级小概率),因此您从采样中获得的值看起来就像随机点并且不包含有用的信息。
因此,要解决您的问题,您需要了解更多信息。例如,如果您对分布的结构有所了解p ( ⋅ ),这可能可以解决您的问题。