如何检验参数的平稳性?

机器算法验证 时间序列 估计 平稳性
2022-04-06 21:08:59

假设我有来自某些人群的分布的时间序列观察结果。也就是说,我观察Xt,i为了t=1,2,...,T,i=1,2,...,n, 我相信Xt,i有pdff(θi). (我对分布有一些想法θi,但这在这里可能并不重要。)我有一些样本统计数据,这是一个很好的估计θi给出了一些观察。

然而,有人怀疑,事实上,θi不是静止的,而是观察来自f(θt,i), 其中θt,i随着时间的推移正在缓慢变化。我如何通过正式的假设检验或“眼球”检验来检验这一点?时域中可用的数据量不是很大( T不是那么大),因此划分时域并计算每个分区上的样本估计值仅适用于少量(比如 5 个)分区(因为否则估计的标准误差太大)。然而,系列的数量,n, 很大,比如 10,000。

我意识到这个问题有很多空白,例如如何θt,i可能会随着时间、参数估计器的标准误差等而变化。但是,任何提示都会受到赞赏。

具体来说,可以想到Xt,i正态分布,均值θ和标准差1,样本统计量是样本均值。

2个回答

在质量控制/统计过程控制设置中会遇到此问题。正如您所暗示的那样,有大量文献,因为从不同形式的抽样不同分布中以各种方式估计的不同参数可以预期以不同方式变化。目的是在该变化发生后尽快在线检测该变化,而不会在此过程中触发太多错误检测。考虑使用控制图 ( 1 , 2 )。在您的具体情况下,一个不错的选择是组合 Shewhart-CUSUM 控制图。

这是时间序列分析中非常普遍的问题。我可能会首先查看一些描述性统计数据,例如互相关,看看样本是否随着时间的推移大致独立。您还可以测试连续样本之间的相关性是否显着。

或者你可以走模型拟合路线,在这种情况下,要做的一件简单的事情是用某个阶数 k 拟合自回归模型,然后与静态模型进行模型比较。如果你假设θ只是遵循高斯随机游走,那么您描述的模型正是卡尔曼滤波器。所以这可能是另一件事。