解释变量中的零值和不连续性

机器算法验证 回归 广义线性模型 造型
2022-03-24 01:53:24

我的一个自变量通过变量来衡量工人的生产力logsales# of workers,我正在为熟练工人创建一个变量,为非熟练工人创建另一个变量。过去一点,随着熟练工人数量的减少,与每名熟练工人的生产率提高有很强的相关性,这就是为什么我认为如果在工人数量为零。对于一名工人,该变量具有非常高的值,而在零工人时,该变量将等于零。同时,将该类别的零个工人排除在外是不可接受的解决方案。

我正在使用具有身份链接功能的 GLM。我怎样才能解释这些观察结果(也许在一个单独的虚拟变量中?)而不会使系数产生偏差?

0个回答
没有发现任何回复~