请参阅编辑。
当你有重尾的数据时,用 student-t 错误进行回归似乎是一件很直观的事情。在探索这种可能性时,我遇到了这篇论文:
Breusch, TS, Robertson, JC, & Welsh, AH(1997 年 11 月 1 日)。皇帝的新装:对多元t回归模型的批判。Statistica Neerlandica, 51, 3.) (链接, pdf )
它认为,尺度参数和自由度参数在某种意义上是不可相互识别的,因此,使用 t 误差进行回归不会做超出标准线性回归所做的任何事情。
Zellner (1976) 提出了一个回归模型,其中数据向量(或误差向量)表示为多元学生 t 分布的实现。该模型引起了相当大的关注,因为它似乎拓宽了通常的高斯假设以允许重尾误差分布。文献中的一些结果表明,在更广泛的分布假设下,高斯模型的标准推理程序仍然是合适的,从而导致标准方法具有稳健性的主张。我们表明,虽然这两个模型在数学上是不同的,但出于统计推断的目的,它们是无法区分的。多元 t 模型的经验含义与高斯模型的经验含义完全相同。因此,更广泛的数据分布表示的建议是虚假的,而稳健性的说法是误导性的。这些结论是从常客和贝叶斯的角度得出的。
这让我很惊讶。
我没有足够的数学能力来很好地评估他们的论点,所以我有几个问题:用 t-errors 进行回归真的没有用吗?如果它们有时有用,是我误解了这篇论文还是有误导性?如果它们没有用,这是众所周知的事实吗?是否有其他方法来解释重尾数据?
编辑:仔细阅读第 3 段和第 4 节后,看起来下面的论文并不是在谈论我所认为的学生 t 回归(错误是独立的单变量 t 分布)。相反,这些错误是从单个分布中得出的,并且不是独立的。如果我理解正确的话,这种缺乏独立性正是为什么你不能独立估计自由度和尺度的原因。
我想这篇论文提供了一份避免阅读的论文列表。