我有一个关于是否使用偏移量的问题。假设一个非常简单的模型,您想在其中描述曲棍球的(总体)进球数。所以你有目标,比赛次数和一个虚拟变量“前锋”,如果球员是前锋则等于 1,否则为 0。那么以下哪个模型是正确指定的?
目标=比赛+前锋,或
目标=偏移(比赛)+前锋
同样,目标是总体目标,而游戏数量是单个玩家的总体游戏。例如,可能有一名球员在 100 场比赛中进了 50 球,而另一名球员在 50 场比赛中进了 20 球,以此类推。
当我想估计进球数时应该怎么做?真的有必要在这里使用偏移量吗?
参考:
我有一个关于是否使用偏移量的问题。假设一个非常简单的模型,您想在其中描述曲棍球的(总体)进球数。所以你有目标,比赛次数和一个虚拟变量“前锋”,如果球员是前锋则等于 1,否则为 0。那么以下哪个模型是正确指定的?
目标=比赛+前锋,或
目标=偏移(比赛)+前锋
同样,目标是总体目标,而游戏数量是单个玩家的总体游戏。例如,可能有一名球员在 100 场比赛中进了 50 球,而另一名球员在 50 场比赛中进了 20 球,以此类推。
当我想估计进球数时应该怎么做?真的有必要在这里使用偏移量吗?
参考:
偏移模型是对每场比赛的目标进行建模,如下所示:
log(goals/games) = a+bx
相当于
log(goals) -log(games) = a+bx
相当于
log(goals)= a+bx +log(games) <-this is an offset model, assumes coef on the last term =1
请参阅此处的幻灯片 35: http ://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/4glm3-ha-online.pdf
如果您认为 a+bx 与进球数与比赛的对数比率(比率)有关,请使用偏移量。如果你觉得有更复杂的游戏效果,也许是积累经验,不要。有关更多讨论,请参阅:http ://ezinearticles.com/?The-Exposure-and-Offset-Variables-in-Poisson-Regression-Models&id=2155811
一些简单的点不能直接解决您关于偏移量的问题: