我正在研究拍卖中的最优出价,并且正在使用逻辑回归来预测在给定一组解释变量(例如我出价、竞争出价数量等)的情况下赢得拍卖的概率。
我想使用的一个解释变量是支付的第二高价格。然而,根据拍卖的设计,我只在我是最高出价者时(即我赢得拍卖时)观察到第二高的价格。
这个缺失的数据是一个主要问题,因为我的数据集表明只有约 20% 的时间中标,因此我不知道 80% 的时间支付的第二高价格。然而直观地说,我不想放弃这个变量,因为在我看来,知道第二高的出价对于确定我中标的机会非常有价值。
因此,是否有任何标准方法来处理这种逻辑回归的缺失数据?