我正在自学一些统计数据,但我对足够的统计数据有些困惑。我将以列表格式写出我的困惑:
如果一个分布有参数然后它会有足够的统计数据?
充分的统计量和参数之间是否存在某种直接对应关系?或者是否将足够的统计数据仅用作“信息”池,以便我们可以重新创建设置,以便我们可以为基础分布的参数计算相同的估计值。
所有分布都有足够的统计数据吗?IE。分解定理会失败吗?
使用我们的数据样本,我们假设数据最可能来自的分布,然后可以计算分布参数的估计值(例如 MLE)。足够的统计数据是一种无需依赖数据本身就能计算出相同参数估计值的方法,对吧?
所有充分统计量的集合是否都具有最小的充分统计量?
这是我用来尝试理解主题的材料: https ://onlinecourses.science.psu.edu/stat414/node/283
据我了解,我们有一个分解定理,它将联合分布分成两个函数,但我不明白我们如何能够在将分布分解为我们的函数后提取足够的统计量。
这个例子中给出的泊松问题有一个明确的因式分解,但随后说明充分的统计量是样本均值和样本总和。我们如何仅通过查看第一个方程的形式就知道这些是充分的统计数据?
如果分解结果的第二个方程有时取决于数据值,如何使用足够的统计量进行相同的 MLE 估计他们自己?例如,在 Poisson 情况下,第二个函数取决于数据阶乘乘积的倒数,我们将不再拥有数据!
为什么样本量就网页上的泊松示例而言,这不是一个足够的统计数据吗?我们会要求重构第一个函数的某些部分,为什么它也不是一个足够的统计数据?