充分统计定义中的条件

机器算法验证 充分统计
2022-04-10 08:45:16

X1,...,Xn是一个带参数的独立同分布样本θT一个统计。如果给定一个值,则统计数据被称为充分t, 分布Pθ(X1,..,Xn|T=t)不依赖于θ.

但是范围是多少t? 我们是否还需要该事件Pθ(T=t)>0对于每个值θ为了确保我们不以空事件为条件?我们需要那个吗SuppθfT对于每个值都是相同的θ? 这种怀疑有意义吗?

ps:问题是在离散分布的设置中提出的。

2个回答

并不总是正的事实的充分性没有影响。上一致时,统计量就足够了. 时, }) 处的联合概率质量函数时也为零, 因此的条件概率给定Pθ(T=t)

T=X(n)=max1inXi
Xi{1,,θ}
Pθ(T=t)=0
θ<t(X1,,Xn,X(n))(x1,,xn,x(n))x(n)>θ(X1,,Xn)X(n)=tt>θ没有定义。但是由于给定上是均匀的,独立于(并且没有另外定义),这不会影响充分性。(x1,,xn)X(n)=t
{(x1,,); x(n)=t}
θt

我假设在的不可能的情况下条件的未定义性质似乎带来了对的一些依赖,但这不是一个正确的印象:条件没有定义,因为调节事件是不可能的。带来信息的部分是,这很好,因为它已经足够了。X(n)=tt>θθθX(n)

这是Koopman (1935)的一篇关于该主题的早期论文的引述:

在此处输入图像描述

他同样认为密度对于实际观察和参数的某些值可能为空这一事实对充分性没有影响。

在高级概率文本中,充分性通常根据样本空间上的分区正式定义,然后我们建立标准定义作为参数模型的含义。无论如何,一旦您转换为通用定义,对充分性的要求是该条件应适用于所有所以一个统计量是足够的当且仅当它有一个条件概率函数满足:tT:RΛθPθ(X|T=t)

Pθ(X|T=t)=Pθ(X|T=t)for all θ,θΘ and tΛ.

请注意,在某些的情况下,条件概率是通过总概率定律定义的——即,它是任何可测量的非负函数,满足:Pθ(T=t)=0t

ΛPθ(XS|T=t)dFT(t)=Pθ(XS)for all θ and measureable S.

后一部分为您提供了一些“回旋余地”,以便在概率测度为零的集合方面足够。如果存在满足上述条件的任何条件概率函数,那么我们可以说统计量是充分的。T


如果您想了解更多有关底层定义的信息,我建议您先查看充分分区的定义。大多数关于中级或高级概率的教科书都会对样本空间分区的初始定义中的充分性进行解释。