
我有一组数据,在我看来可以被视为来自泊松分布(它们都是正数并代表天数)。我需要使用这些数据作为因变量,使用 R 执行几个回归。我尝试了线性模型(使用 Box-Cox 变换处理数据)和glm所有可能的族,但是当我检查残差是否正态分布(使用夏皮罗检验)时,答案总是是否定的。关于任何其他可能的分布系列的任何想法?谢谢!

我有一组数据,在我看来可以被视为来自泊松分布(它们都是正数并代表天数)。我需要使用这些数据作为因变量,使用 R 执行几个回归。我尝试了线性模型(使用 Box-Cox 变换处理数据)和glm所有可能的族,但是当我检查残差是否正态分布(使用夏皮罗检验)时,答案总是是否定的。关于任何其他可能的分布系列的任何想法?谢谢!
(评论太长了;如果您回复其中一些问题,希望它会成为一个更完整的答案)
最重要的:
当您说“天数”时,您是在看时间间隔吗?
时间间隔,例如某个开始事件和某个结束事件之间的天数不会是 Poisson。
泊松用于(独立)事件的计数,而不是它们之间经过的时间间隔的计数。您可能会考虑为那些指数或伽马 GLM。
其次:
为什么你认为你需要 GLM 的残差是正常的?
--
一个潜在的答案:如果您的数据是真正的计数数据*,那么您可能会考虑负二项式。
负二项式往往有点类似于泊松(泊松确实是一个特例),但方差更大。
http://en.wikipedia.org/wiki/Negative_binomial_distribution
*(尽管如此,最好有更多细节,因为细节往往会暗示要考虑哪些分布)