均值的稳健 t 检验

机器算法验证 假设检验 t检验 金融 强大的
2022-02-13 22:05:48

我正在尝试针对随机变量 X 测试空,针对局部替代,受随机变量的轻度到中度偏斜和峰度的影响。根据 Wilcox 在“稳健估计和假设检验简介”中的建议,我查看了基于修剪均值、中位数以及位置 M 估计量的检验(Wilcox 的“一步”程序)。当使用非偏斜但细峰分布进行测试时,这些稳健的测试在功效方面确实优于标准 t 检验。E[X]=0E[X]>0X

但是,在使用偏态分布进行测试时,这些单边测试在原假设下要么过于自由,要么过于保守,具体取决于分布是左偏还是右偏。例如,对于 1000 个观察值,基于中位数的检验实际上会拒绝约 40% 的时间,在名义上的 5% 水平。原因很明显:对于偏态分布,中位数和均值有很大不同。但是,在我的应用程序中,我真的需要测试平均值,而不是中位数,而不是修剪后的平均值。

是否有更强大的 t 检验版本可以实际测试均值,但不受偏斜和峰度的影响?

理想情况下,该过程在无偏斜、高峰度的情况下也能很好地工作。“一步”测试几乎足够好,“弯曲”参数设置相对较高,但在没有偏斜的情况下,它的功能不如修整均值测试,并且在保持偏斜下的标称不合格水平方面存在一些问题.

背景:我真正关心平均值而不是中位数的原因是该测试将用于金融应用程序。例如,如果您想测试投资组合是否具有正的预期对数回报,则平均值实际上是合适的,因为如果您投资该投资组合,您将体验到所有回报(即平均数乘以样本数),而不是中位数的副本。也就是说,我真的很关心从 RV总和。nnX

4个回答

我同意,如果您想实际测试组均值是否不同(而不是测试组中位数或修剪均值之间的差异等),那么您不想使用测试不同假设的非参数检验。

  1. 一般来说,考虑到残差正态性假设的适度偏离,来自 t 检验的 p 值往往相当准确。查看此小程序以了解这种稳健性:http: //onlinestatbook.com/stat_sim/robustness/index.html

  2. 如果您仍然担心违反正态性假设,您可能需要引导. 例如,http ://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. 您还可以转换偏斜的因变量来解决偏离正态的问题。

为什么要查看非参数测试?是否违反了 t 检验的假设?即,序数或非正态数据和不恒定的方差?当然,如果您的样本足够大,尽管样本中缺乏正态性,您仍可以用更大的功效证明参数 t 检验的合理性。同样,如果您担心方差不等,则可以对参数检验进行更正以产生准确的 p 值(Welch 校正)。

否则,将您的结果与 t 检验进行比较不是解决此问题的好方法,因为当不满足假设时,t 检验结果是有偏差的。Mann-Whitney U 是一个合适的非参数替代方案,如果这是您真正需要的。只有当您可以合理地使用 t 检验时(因为满足假设),您才在使用非参数检验时失去功效。

而且,只是为了了解更多背景信息,请转到此处:独立样本的学生 t 检验

Johnson (1978)统计量和置信区间进行了修改,这是解决我的问题的一个很好的起点。校正基于 Cornish-Fisher 展开,并使用样本偏斜。t

“最新和最伟大的”归功于小笠原,其中提到了霍尔和其他人。

我没有足够的评论声誉,因此作为答案:看看这个计算。我认为这提供了一个很好的答案。简单来说:

渐近性能对偏度形式的正态性偏差比峰度形式的偏差更敏感......因此,学生 t 检验对偏度敏感,但对重尾相对稳健,因此使用测试是合理的在应用 t 检验之前针对偏斜备选方案的正态性。