根据此处的PDF:https ://www.math.arizona.edu/~tgk/466/sufficient.pdf ,当方差未知时,数据样本的总和对于正态分布来说不是足够的统计量。相反,总和和平方和是联合充分的统计量。现在,假设我们有一个有两个玩家的游戏。他们都知道有五个样本是从某个正态分布中抽取的。他们都不知道用于生成数据的正态分布参数。游戏的目标是估计正态分布的均值。更接近真实均值的玩家赢得 1美元(估计值和实际值之间的绝对差值是目标函数)。
第一个玩家得到了所有五个样本,而第二个玩家只得到了样本的总和(他知道其中有五个)。
如果在方差未知的情况下,单独的总和还不够统计,那么第一个玩家可以应用什么策略来使用所有五个数据点在多个此类游戏中赢钱?
作为后续,假设分布不再正常,玩家知道它是什么(不知道参数)。他们仍然必须根据所提供的信息来估计真正的平均值。是否有第一个玩家将具有重大优势的分布示例?
最后,如果两个玩家都不知道生成样本的分布是什么?现在第一个玩家有什么优势吗?
