在所有情况下,我都熟悉交叉验证,它仅用于提高预测准确性的目标。交叉验证的逻辑可以扩展到估计变量之间的无偏关系吗?
虽然Richard Berk 的这篇论文演示了在“最终”回归模型中使用保留样本进行参数选择(并说明了为什么逐步参数选择不是一个好主意),但我仍然不明白这如何确保对 X 对 Y 的影响的无偏估计比根据主题的逻辑和先验知识选择模型更重要。
我要求人们引用一些例子,在这些例子中,有人使用保留样本来帮助进行因果推理,或者可以帮助我理解的一般论文。我也不怀疑我对交叉验证的概念是幼稚的,所以如果是这样的话。似乎临时使用保留样本可以进行因果推理,但我不知道有任何工作可以做到这一点或他们将如何做到这一点。
伯克论文的引文:
模型选择后的统计推断 作者:Richard Berk、Lawrence Brown、Linda Zhao 定量犯罪学杂志,Vol。26,第 2 期。(2010 年 6 月 1 日),第 217-236 页。
PDF版本在这里
chl 关于小样本研究中探索性数据分析的这个问题提示了这个问题。