我需要对二进制标签进行分类。数据集代表一个贷款程序。因此,一行是特定情况下过程的特定时刻。
数据集由9000多个案例组成(属性CaseID)
例子:
CaseID 1:由 8 行(每行代表一个时刻)的过程组成,最终接受或拒绝贷款。
CaseID 2:由 20 行组成
等等等等
我已经能够在每个案例中将这些行组合成一行,然后进行预测。但我也想保持这些过程的顺序,因为它可能会提高模型的性能(随机森林和 XGboost)。
我的问题是:我如何对模型说使用这个案例的前 8 行来告诉我这个案例的标签是什么,并使用前 20 行来预测下一个案例的标签等?
我希望问题很清楚?