斯坦博偏差定义

机器算法验证 时间序列 自相关 偏见
2022-04-14 13:05:16

你会如何用简单的相对非技术性的语言来解释“斯坦博偏见”?

2个回答

不幸的是,我不确定你是否可以在不使用一些技术术语的情况下解释这个术语。我会尽力而为。

首先是一些定义:

  1. 偏差:估计器的期望值与您正在估计的参数的真实值之间的差异。
  2. OLS:普通最小二乘;一种解决回归问题的方法。
  3. 自回归过程(AR):(通过维基百科)

当您对滞后的随机输入执行回归时,就会出现Stambaugh 偏差。本质上,当您这样做时,您必须使用输入(回归器)的估计值,这需要估计自相关系数。然后,自相关系数的偏差与 OLS 的斜率系数估计值的偏差成正比。如果您知道计算自相关系数的方法存在偏差,则可以对此进行纠正。

原始论文真的不是太复杂,只要你知道什么是 AR 过程以及 OLS 回归是如何工作的:论文

这是解释 Stambaugh 偏差的原始论文:Stambaugh (JFE1999)当股息收益率过程高度持续时,它检查了过去股息收益率回报预测回归中斜率系数的偏差。

表示日期返回,表示日期股息收益率。考虑以下回归方程: for with yttxt=Dt/Ptt

yt=α+βxt1+utxt=θ+ρxt1+vt
t=1,,T[utvt]=N(0,Σ=[σu2σuvσuvσv2])

论文表明,中的偏差为 其中是 \rho 的 OLS 估计β

E[β^β]=σuvσv2E[ρ^ρ],
ρ^ρ

该论文表明有一个向下的偏差,而是负的,导致有一个向上的偏差。ρ^σuvβ^