我正在使用 Lasso 在相对较低的维度设置(n >> p)中进行特征选择。拟合 Lasso 模型后,我想使用具有非零系数的协变量来拟合没有惩罚的模型。我这样做是因为我想要 Lasso 无法给我的公正估计。我还想要无偏估计的 p 值和置信区间。
我很难找到关于这个主题的文献。我发现的大多数文献都是关于在 Lasso 估计上放置置信区间,而不是改装模型。
根据我的阅读,简单地使用整个数据集重新拟合模型会导致不切实际的小 p 值/标准误差。目前,样本拆分(采用 Wasserman 和 Roeder(2014)或 Meinshausen 等人(2009)的风格)似乎是一个很好的行动方案,但我正在寻找更多建议。
有没有人遇到过这个问题?如果是这样,请您提供一些建议。