在 LASSO 中处理分层(面板、多级)数据和固定效果?

机器算法验证 机器学习 套索 固定效应模型
2022-03-17 18:29:31

这个问题几乎可以解释自己。在对许多索引(例如按时间和位置)解释变量运行 Lasso 回归时,最佳做法是使用第一个位置然后时间上的内部转换来转换所有数据?例如...

yl,tnew=(yl,t1Tt=1Tyl,t1Nl=1Nyl,t+y¯¯)

1个回答

首先要做的是将数据重新排列为标准形式。如果你有样本和个特征,这意味着你想要nd

  • 一个输入矩阵,其中每一列的平均值为,方差为这确保了 LASSO 的正则化效果在决定是否将其缩小为零时“公平”地对待每个维度。n×dX01
  • 一个长度的输出向量,其平均值为这确保了 LASSO 模型不需要使用常数项。ny0

您可能希望将时间和位置编码为维度(即作为中的额外列),但不知道问题的细节我不能肯定地说。X

无论如何,如果您将输入 LASSO 求解器,您将得到一个长度为的权重向量,然后您可以根据时间、位置以及您拥有的任何其他解释变量来解释它。Xydw