假设我有一组独立的、同分布的单变量观察以及关于如何的两个假设生成:
: 是从具有未知均值和方差的单个高斯分布中得出的。
: 是从具有未知均值、方差和混合系数的两个高斯的混合中得出的。
如果我理解正确,这些是嵌套模型,因为模型表示可以描述为如果您将两个高斯的参数约束为相同,或者将两个高斯之一的混合系数约束为零。
因此,您似乎应该能够使用 EM 算法来估计然后用 Wilks 定理判断数据是否符合明显大于下. 对于 EM 算法将收敛到最大似然度的假设,有一个小小的信念飞跃,但这是我愿意做的。
我在蒙特卡罗模拟中尝试了这个,假设自由度比多 3 个(第二个高斯和混合参数的均值和方差)。当我模拟来自,我得到了一个 P 值分布,它基本上是不均匀的,并且富含小 P 值。(如果 EM 没有收敛到真正的最大似然,则完全相反。)我应用 Wilks 定理导致这种偏差有什么问题?