案例加权逻辑回归

机器算法验证 物流
2022-03-08 23:01:22

我正在研究一些逻辑回归问题。(“常规”和“有条件”)。

理想情况下,我想对每个输入案例进行加权,以便 glm 将更多地专注于正确预测较高权重的案例,而代价是可能对较低权重的案例进行错误分类。

当然,这在以前已经做过了。谁能指出我一些相关的文献(或者可能建议修改似然函数。)

谢谢!

2个回答

glmweights正好为此目的保存一个参数。你为它提供一个任意比例的数字向量,它拥有与你观察到的相同数量的权重。

我现在才意识到你可能不会说话R如果没有,你可能想要。

如果您可以访问 SAS,则使用 PROC GENMOD 很容易完成。只要每个观察值都有一个权重变量,使用权重语句将允许您执行您正在寻找的那种分析。我主要使用逆概率治疗权重来使用它,但我看不出为什么你不能为数据分配权重以强调某些类型的案例,只要你确保你的 N 保持不变。您还需要确保包含某种 ID 变量,因为从技术上讲,加权的案例是重复观察。示例代码,观察 ID 为“id”,权重变量为“wt”:

proc genmod data=work.dataset descending;
    class id;
    model exposure = outcome covariate / dist=bin link=logit;
    weight wt;
    repeated subject=id/type=ind;
run;