比率(例如 = /)经常使用(例如 mRNA 或蛋白质表达的倍数变化、体重指数 [BMI] 等)。许多人建议编码为比率的变量(例如倍数变化)应该进行对数转换,因为它们严重向右倾斜。但是,比率 ( / ) 是相对变化,比率分布不正常 (en.wikipedia.org/wiki/Ratio_distribution)。如果和都是对数正态的,那么 log( / ) 是正态的(考虑重转换偏差后 /
对数转换比率之间的比较是相对变化(即比率)的相对变化。此外,对右偏变量()进行对数转换的必要性也受到质疑。例如,最近的一篇论文 ( http://www.ncbi.nlm.nih.gov/pubmed/22806695 ) 对变量对数转换的误用提出了警告。一些建议是 log( ) 仅当是对数正态时才保证正态分布。也就是说,即使对于右偏变量,它也不能保证正态性。此外,E(log(的几何平均值 (GM) ,它总是小于 E( ) 和 E( ) 和 GM 不同。最后,GM 既不太稳健,也不太可能受到异常值的影响。
另一篇论文 ( http://econtent.hogrefe.com/doi/10.1027/1614-2241/a000110 ) 表明,即使对于对数正态分布的变量,对原始变量的 t 检验也表现良好。第 3 篇论文 ( http://link.springer.com/article/10.1023%2FB%3AEEST.0000011364.71236.f8 ) 表明 t 检验对比率的性能和对数转换比率的 t 检验是相似的。
因此,问题变成了哪个是感兴趣的结果。因为 log( ) 必须被反向转换为原始单位才有意义,并且由于重新转换偏差,我认为 E( ) 的测试更有意义。
幸运的是,一旦考虑了异方差性(例如 Welch 的 t 检验),参数检验(例如 t 检验)对于违反正态性假设的情况是稳健的。例如,这篇论文 ( http://www.ncbi.nlm.nih.gov/pubmed/24738055 ) 建议使用 ANOVA 来测试免疫印迹中原始倍数变化之间的差异。
所以我的问题是:如果我的目标是测试比率的绝对变化,我可以直接比较比率而不进行对数转换吗?