Andrew Gelman 在其博客最近的一篇文章中建议使用等级,将等级转换为 z 分数,然后使用参数测试和工具,而不是执行非参数测试。我以前从未听说过。
在 Google 上的搜索将我指向GenABEL 包中的这个 R 函数,它似乎执行数据向量的 rank+z 变换,但我找不到评估或讨论在转换后的数据上使用参数测试的想法的论文Wilcoxon 测试。
谁能给我指出一些关于这种方法的文献?
Andrew Gelman 在其博客最近的一篇文章中建议使用等级,将等级转换为 z 分数,然后使用参数测试和工具,而不是执行非参数测试。我以前从未听说过。
在 Google 上的搜索将我指向GenABEL 包中的这个 R 函数,它似乎执行数据向量的 rank+z 变换,但我找不到评估或讨论在转换后的数据上使用参数测试的想法的论文Wilcoxon 测试。
谁能给我指出一些关于这种方法的文献?
(将 Conover [1] 从书架上拉下来……)
这个想法很老了。它至少可以追溯到van der Waerden (1952/1953) [2][3],他提出了一种与 Kruskal Wallis 相对应的测试,但等级被正常分数取代。(使用有序随机正态值而不是其期望值或中值的近似值的想法可能更早一些。)
根据 Conover 的说法,Fisher 和 Yates (1957) [4] 建议在假设正态性的各种测试中用预期的正态分数(即转换的秩)替换观察值。
正常情况下的渐近相对效率将为 1,这听起来很有吸引力……但是,即使在正常情况下,与 Wilcoxon-Mann-Whitney(获得权力)相比的优势也很小,而且如果分布比正常分布更重(例如逻辑),则这样做可能是不利的。(一些模拟表明事实确实如此:除非分布已经接近正常 - 在这种情况下进行转换没有任何好处 - 这样的转换实际上可能会失去力量。)
Chernoff & Lehmann [5] 计算各种分布的渐近幂;在至少有一个非常短的尾巴(例如制服)的情况下,对于 Wilcoxon-Mann-Whitney 的换档替代方案,正常分数测试可以有更好的 ARE - 比 t 检验本身更好。他们的结果与我对重尾案例的模拟一致。
请注意,在两个样本的情况下,随着均值的分离变大,而组合样本看起来很正常,这两个样本根本不正常:

因此,并非正态测试的所有属性都将延续到正态分数测试,并且较大分离(小样本)的行为可能有点违反直觉。
通过这个想法获得的测试有时统称为正常分数测试,搜索词(例如通过谷歌)会出现许多参考。
例如,在这里,Richard Darlington 讨论了为 Wilcoxon 符号秩检验做这件事;他指出与普通等级检验相比有一个优势,因为它减少了检验统计量的并列值的数量。
在我结束在它上面写几页之前,我会让你进一步搜索。
Conover 列出了许多其他参考资料并进行了相当多的讨论,因此我绝对建议您阅读。
然而,Gelman 的观点似乎是为了方便——不需要在每次情况发生变化时都开发新的测试;虽然如果方便是主要问题,那么已经能够对我们喜欢的任何统计数据使用置换测试。[使用正常分数方法,困难在于我们仍然需要一种合适的排名方式——你不能只对在 null 下无法比较的事物进行排名,并期望得到正确的行为。置换测试也有类似的问题,因为您同样需要在 null 下的可交换性。]
您提到了一个 R 函数,但您可以在 R 中轻松排名并转换为正常分数,只需使用 R 已经附带的函数。
例如,使用sleepR 中的数据。您可以通过这种方式进行 t 检验:
t.test(extra ~ group, data = sleep) # Welch
t.test(extra ~ group, data = sleep, var.equal=TRUE) # equal-variance
t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep) # normal scores
[1] Conover, WJ (1980),
实用非参数统计, 2e。
威利。第 316-327 页。
(从上面的 Wikipedia 链接看来,在 3e(1999)中,讨论从 p396 开始)
[2] van der Waerden, BL (1952),
“两样本问题的顺序检验及其功效”,
Koninklijke Nederlandse Akademie van Wetenschappen 会议记录,意甲55(Indagationes Mathematicae 14),453-458。
[3] van der Waerden, BL (1953),
"Order tests for the two-sample problem. II, III",
Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303–310 & 311-316。
(该卷第 80 页上的 1952 年论文也有更正)
[4] Fisher RA 和 Yates F. (1957)
生物、农业和医学研究统计表,5e,Oliver & Boyd,爱丁堡。
[5] 霍奇斯,JL;Lehmann, EL (1961),
“正态分数和 Wilcoxon 检验的比较”
,第四届伯克利数理统计和概率研讨会论文集,第 1 卷:对统计理论的贡献,307--317,
加州大学出版社,加利福尼亚州伯克利
http://projecteuclid.org/euclid.bsmsp/1200512171。