为什么贝叶斯 p 值除了数据之外还涉及参数?

机器算法验证 贝叶斯 p 值 拟合优度
2022-04-13 20:07:52

在 Gelman 的贝叶斯数据分析的第 146 页,Gelman 讨论了将贝叶斯 p 值作为检查模型拟合的一种方法。这个想法是将观察到的数据 ( )可能由模型生成的数据进行比较yyrep

他将贝叶斯 p 值定义为

pB=Pr(T(yrep,θ)T(y,θ)|y)

我不太明白为什么让测试统计量成为参数的函数是有意义的。实际上,如果目标是“将观察到的数据模型可能生成的数据进行比较”,那么不应该严格在之间进行比较吗?θyyrep

例如,在同一页上,Gelman 提供了一个检查正常模型拟合的示例。检验统计量为:

T(y,θ)=|y(61)θ||y(6)θ|

其中是正常模型的平均值。此检验统计量旨在忽略模型拟合的极端尾部,超出 6 阶和 61 阶统计量。θ

为什么我们不使用以下测试统计量,而纯粹依赖数据?

T(y,θ)=|y(61)y¯||y(6)y¯|

2个回答

p 值用于表示模型测试中的结果及其参数(用于测试假设)。通常,它与一些测量差异的统计数据(例如与预期均值的距离)有关。

P(T>tobserved|H0)

给定零假设的观察值大于统计量的观察值的概率TH0tobserved

贝叶斯 p 值大致相同。它用于测试用于拟合模型的假设。这种方式就像是拟合优度的测试(例如像 Pearson 的卡方检验)。与贝叶斯 p 值/假设的主要区别在于模型没有固定参数,而是参数本身就是变量。


我不太明白为什么让测试统计量成为参数的函数是有意义的,θ

用于将观察结果与假设模型进行比较的统计量通常是一个关键量

  • 您不比较两个观察结果。例如是否Yrep>Y
  • 但是,您可以比较与假设模型相关的两个观察结果。例如是否. 观察与模型模式的差异是否相当,或者它是否是我们应该将观察视为异常的不太可能的值。|Yrepμ|>|Yμ|YYrep

我希望这种观察和模型的差异具有直观的意义。这些用于计算 p 值的统计数据可能有些随意。似然比检验使这更正式一点。


为什么我们不使用以下测试统计量,而纯粹依赖数据?

T(y,θ)=|y(61)y¯||y(6)y¯|

我们不会纯粹根据数据进行统计,因为我们想测试与模型相关的数据。需要依赖于,否则它将不适合θθ

您可以以某种方式使用“数据”测试数据的统计数据表达式。

T(y,θ)=|y(61)y^||y(6)y^|

这里是 y 的估计y^y

没有什么能阻止您使用仅基于复制数据的测试统计数据。

示例中的要点是模型假设yi正态分布在平均值附近θ不在身边y¯. 因此,Gelman 等人提供了检验统计量。人。测试一些关于正态性假设的东西,而它并不清楚你的测试统计量正在测试什么。