充分统计的目的和机制背后的直观意义是什么?

机器算法验证 回归 充分统计
2022-03-20 19:31:02

充分统计量的定义是:令索引的分布的随机样本为统计量。假设对于 T 的每个和每个可能的值的条件联合分布给定只取决于而不是那么,是参数的充分统计量。X1,...,XnθTθtTX1,...,XnT=ttθTθ

我觉得我知道了几个难题(例如分解定理)来理解足够的统计数据,但没有完整的理论。

我的主要问题是:

1)为什么他们说是参数的充分统计量如果是正态分布的总体均值,比如说,这是否意味着无论何时我们想要找到以某种方式发生的概率,我们都不需要人口的平均值?TθθμX1,...,Xn

2)在现实生活中,我们为什么要使用足够的统计量?似乎仅仅计算统计数据不应该做太多工作(例如 X 的总和),那么我们为什么需要它呢?

谢谢!

1个回答
  1. 不。他们说的是,如果相同总体的另一个随机样本的等量概率信息因此,如果我们保留并丢弃 ,我们可以“恢复数据” 。这就是为什么是“足够的”。X1,,XnX1,,XnθTX1,,XnT

  2. 数据缩减。如果足够,那么只要携带的“额外信息”就毫无价值。然后很自然地考虑不使用这些额外不相关信息的推理过程。这导致了充分性原则:任何推理过程都应该仅通过充分的统计量来依赖数据。TXθ

有关数据缩减所涉及原则的更多详细信息,请参见此处。