这似乎很简单,但我总是卡在这一点上......
我处理的大多数数据都是非正态的,并且大多数分析基于 GLM 结构。对于我目前的分析,我有一个响应变量是“步行速度”(米/分钟)。我很容易确定我不能使用 OLS,但是,我在决定什么家庭(Gamma、Weibull 等)是合适的时有很大的不确定性!
我使用 Stata 并查看残差和异方差性、残差与拟合值等诊断。
我知道计数数据可以采用比率的形式(例如发病率)并使用伽玛(类似于过度分散的离散负二项式模型),但只是希望“确凿证据”说是的,你有正确的家庭。查看标准化残差与拟合值是唯一且最好的方法吗?我也想使用混合模型来解释数据中的一些层次结构,但首先需要弄清楚哪个系列最能描述我的响应变量。
任何帮助表示赞赏。Stata语言特别赞赏!