我有以下广义线性模型。该对象glmDV被建模为成功与总试验的比例。对象x_i是连续变量。
这在数学符号中是什么样子的?
winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7,
data=myData, family=binomial("logit"))
我有以下广义线性模型。该对象glmDV被建模为成功与总试验的比例。对象x_i是连续变量。
这在数学符号中是什么样子的?
winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7,
data=myData, family=binomial("logit"))
对于二元逻辑回归(带有 logit 链接的二项式 GLM 的常见用例),您正在对因变量为“成功”(或“是”)的概率进行建模,通常编码为。您这样做的方式是对对数几率进行建模。因此,不是像在 OLS 中那样对响应的平均值进行建模,而是对对数几率的变化进行建模:
其中和。
可以在 Agresti, An Introduction to Categorical Data Analysis 中找到对此更彻底、更平易近人的解释。
但是对于您的特定问题,您声明您正在模拟成功的比例。这实际上并不是二项式 GLM 的用途。但是,您真正追求的是二项式 GLM 所做的,并且在 R 中仍然是可能的。它只需要对您正在做的事情进行轻微调整。在你有有限数量的试验可能有成功的情况下,你仍然可以使用相同的模型,它具有密度 因为您的值是由实验设计固定的,并且是您观察到的成功,所以您正在对参数进行推断
就 R 而言,只需创建一个对象(您称其glmDV为 2 列矩阵),第一列是成功次数,第二列是失败总数。声明的其余部分保持不变!