我设计了这个玩具示例
library(sigmoid)
N <- 10000
age <- runif(N, min=20, max=90)
e <- rnorm(N, 0, 5)
hi <- logistic(-100+2*age+e)
hid <- ifelse(hi>=0.5, T, F)
hid <- as.factor(hid)
df <- data.frame(age=age, hid=hid)
lr <- glm(hid~age, data=df, family=binomial(link="logit"))
s <- summary(lr)
print(s)
该变量hid
包含 4304 FALSE 和 5696 TRUE。
我本来希望从逻辑回归中得到正确的系数。
相反,我得到 -39.46 的截距和 0.79 的斜率。两者都具有 p 值0。
我究竟做错了什么?