t 统计量作为检验统计量很有意义。许多人觉得它很直观。如果我引用 0.5 或 5.5 的 t 统计量,它会告诉您一些信息——除均值之外有多少标准误。
困难——至少在适度的非正态性下——与其说是使用统计量,不如说是使用t 分布作为其在零值下的分布。统计数据非常合理。
当然,如果您预计尾部比正常值大得多,那么更稳健的统计量会更好,但 t 统计量对与正态性的轻微偏差并不高度敏感(例如,它不如方差比统计量敏感)。
如果您只想使用统计数据的分子,那很好,如果您对均值的差异感兴趣,它作为排列统计数据非常有意义。如果您对更一般的位置转移感感兴趣,它会打开大量其他可能性。
你认为有很大的自由来选择统计数据并根据特定情况对其进行调整是正确的——你想要对抗哪些替代方案,或者你希望能够应对哪些可能的问题(例如污染,可以冲击力)。
实际上几乎没有任何限制——您可以自由选择几乎任何东西,包括无用的测试统计信息。当然,在选择测试时,您确实应该考虑一些考虑因素,但您可以不考虑。
--
也就是说,有一些标准可以应用于各种情况。
例如,如果您对特定类型的假设特别感兴趣,则可以使用反映该假设的统计量 - 例如,如果您想检验总体均值的差异,则通常将检验统计量设为有意义与样本均值的差异有关。
如果您对可能具有的分布类型有所了解 - 重尾,或偏斜,或名义上轻尾但有一定程度的污染,或双峰,......您可以设计一个在这种情况下可能表现良好的检验统计量,例如,选择在预期情况下表现良好但对污染具有一定鲁棒性的统计数据。
--
模拟是在各种情况下调查功率的一种方法。