我有一个普遍的方法论问题。之前可能已经回答过,但我无法找到相关的线程。我将感谢指向可能重复的指针。
(这是一个很好的,但没有答案。这在精神上也很相似,即使有答案,但从我的角度来看,后者太具体了。这也很接近,在发布问题后发现。)
主题是,在看到数据之前制定的模型未能充分描述数据生成过程时,如何进行有效的统计推断。这个问题非常笼统,但我将提供一个具体的例子来说明这一点。但是,我希望答案集中在一般的方法问题上,而不是对特定示例的细节进行挑剔。
考虑一个具体的例子:在时间序列设置中,我假设数据生成过程是 和。的主题假设。我根据模型进行了转换,以获得我的主题假设的可行统计对应物,这是 到现在为止还挺好。但是当我观察数据时,我发现模型没有充分描述数据。比方说,有一个线性趋势,所以真正的数据生成过程是 和
如何对我的主题假设进行有效的统计推断?
如果我使用原始模型,它的假设就会被违反,并且的估计量没有它本来应该有的良好分布。因此,我无法使用检验来检验假设。
如果在查看数据后,我从模型切换到并将我的统计假设从更改为,模型假设得到满足并且我得到一个行为良好的估计量,并且可以使用。 然而,从到
由我希望检验假设的数据集提供信息。这使得估计量分布(因此也是推断)取决于基础模型的变化,这是由于观察到的数据。显然,这种调节的引入并不令人满意。
有什么好的出路吗?(如果不是常客,那么也许是一些贝叶斯替代方案?)