我正在研究一些逻辑回归问题。(“常规”和“有条件”)。
理想情况下,我想对每个输入案例进行加权,以便 glm 将更多地专注于正确预测较高权重的案例,而代价是可能对较低权重的案例进行错误分类。
当然,这在以前已经做过了。谁能指出我一些相关的文献(或者可能建议修改似然函数。)
谢谢!
我正在研究一些逻辑回归问题。(“常规”和“有条件”)。
理想情况下,我想对每个输入案例进行加权,以便 glm 将更多地专注于正确预测较高权重的案例,而代价是可能对较低权重的案例进行错误分类。
当然,这在以前已经做过了。谁能指出我一些相关的文献(或者可能建议修改似然函数。)
谢谢!
glm
weights
正好为此目的保存一个参数。你为它提供一个任意比例的数字向量,它拥有与你观察到的相同数量的权重。
我现在才意识到你可能不会说话R
。如果没有,你可能想要。
如果您可以访问 SAS,则使用 PROC GENMOD 很容易完成。只要每个观察值都有一个权重变量,使用权重语句将允许您执行您正在寻找的那种分析。我主要使用逆概率治疗权重来使用它,但我看不出为什么你不能为数据分配权重以强调某些类型的案例,只要你确保你的 N 保持不变。您还需要确保包含某种 ID 变量,因为从技术上讲,加权的案例是重复观察。示例代码,观察 ID 为“id”,权重变量为“wt”:
proc genmod data=work.dataset descending;
class id;
model exposure = outcome covariate / dist=bin link=logit;
weight wt;
repeated subject=id/type=ind;
run;