独立伯努利试验与马尔可夫链

机器算法验证 预测模型 自相关 马尔科夫过程 自回归的 伯努利过程
2022-04-06 04:19:02

原始问题

假设我们有一系列伯努利试验,它们按时间排序,可能是独立的,也可能不是独立的。我有兴趣了解成功的可能性。我的想法是,我有两个主要选择。X1,X2,XT

  1. 考虑试验,和估计XtiidBern(θ)θ
  2. 将观察结果视为马尔可夫链(时间 t 的成功/失败的成功概率有影响tt+p

我如何确定哪种型号最好?或者换句话说,我如何估计马尔可夫链的顺序。

为了测试第一个模型的有效性,我正在考虑使用 Andrew Gelman 在他的贝叶斯数据分析通过模拟构建了一个“经验 p 值”除此之外,我不确定如何适当地比较不同的模型。T=longest streak of successes

部分回答

看来 PACF(部分自相关函数)可用于估计这些序列的顺序。

我生成了伯努利试验的 3 个大序列,在独立、一阶马尔可夫依赖和二阶马尔可夫依赖下。我们为每种情况绘制 ACF。 (T=1000)在此处输入图像描述

此外,对于一阶马尔可夫链,ACF 似乎满足 AR(1) 模型的性质ρk=ρ1k

在此处输入图像描述

但是,我似乎找不到任何正式的理由来说明为什么这样做。据我了解,如果伯努利试验满足阶马尔可夫属性,这并不意味着链是过程,因为我们不能 同住。(如果有人可以对此进行确认或纠正,那就太好了)。pAR(p)

Xt=ϕXt1+ϵt
ϵt

那么如果阶马尔可夫过程不是过程,为什么会这样呢?pAR(p)

1个回答

作为一般规则,如果你想检验一个假设H0反对HA,您必须指定一个包含两种可能性的模型,然后使用该模型来尝试推断哪个假设是正确的。因此,如果您认为您观察到的时间序列数据可能具有某种形式的自相关,并且您想对此进行测试,那么将它们建模为 IID 是不好的。您需要使用允许自相关的模型,但也允许作为特例的独立性,以便可以在模型内测试这些相互竞争的假设。

您是正确的,在这种情况下,连续变量的标准 AR(1) 自相关结构并不好。相反,您需要制定某种适用于一系列伯努利试验的模型。对于一系列伯努利试验,该过程的平稳马尔可夫链将有两个参数0<θ0<10<θ1<1并使用递归方程:

X1Bern(θ01+θ0θ1)Xt+1|XtBern(θXt).

这给出了一个一般的平稳马尔可夫链,其中伯努利试验中的概率取决于先前的结果。可以证明Corr(Xt+1,Xt)=θ1θ0在这个模型中,所以如果你想测试独立性,你将测试假设:

H0:θ1=θ0HA:θ1θ0.

应该可以将此模型拟合到您的数据,估计模型的参数,并检验独立性假设。这可以使用经典或贝叶斯方法来完成。