我指的是这篇文章 ,它似乎质疑残差正态分布的重要性,认为这与异方差一起可以通过使用稳健的标准误差来避免。
我已经考虑了各种转换 - 根、日志等 - 事实证明,所有这些都无法完全解决问题。
这是我的残差的QQ图:
数据
- 因变量:已经使用对数变换(修复异常值问题和此数据中的偏度问题)
- 自变量:公司年龄和一些二元变量(指标)(稍后我有一些计数,用于作为自变量的单独回归)
Stata 中的iqr
命令 (Hamilton) 没有确定任何排除正态性的严重异常值,但下图表明并非如此,Shapiro-Wilk 检验也是如此。