一位同事正在为她的论文分析一些生物学数据,其中包含一些令人讨厌的异方差性(下图)。她正在使用混合模型对其进行分析,但仍然遇到残差问题。
对响应变量进行对数转换可以清理事情,并且根据对这个问题的反馈,这似乎是一种合适的方法。然而,最初,我们认为在混合模型中使用转换变量存在问题。事实证明,我们误解了 Littell & Milliken (2006) SAS for Mixed Models中的一个声明,该声明指出了为什么不适合转换计数数据然后使用正常的线性混合模型对其进行分析(完整引用如下) .
一种也改善残差的方法是使用具有泊松分布的广义线性模型。我读过泊松分布可用于对连续数据进行建模(例如,如本文所述),并且 stats 包允许这样做,但我不明白当模型拟合时会发生什么。
为了了解如何进行基础计算,我的问题是:当您将泊松分布拟合到连续数据时,1)数据是否四舍五入到最接近的整数2)这是否会导致信息丢失和3)什么时候,如果有的话,对连续数据使用泊松模型是否合适?
Littel & Milliken 2006, pg 529 “转换 [count] 数据可能会适得其反。例如,转换可能会扭曲随机模型效应的分布或模型的线性。更重要的是,转换数据仍然存在可能性负预测计数。因此,使用转换数据从混合模型推断是高度可疑的。