我想使用 XGB 回归。数据框在概念上类似于此表:
index feature 1 feature 2 feature 3 encoded_1 encoded_2 encoded_3 y
0 0.213 0.542 0.125 0 0 1 0.432
1 0.495 0.114 0.234 1 0 0 0.775
2 0.521 0.323 0.887 1 0 0 0.691
我的问题是,对编码特征的不平衡观察有什么影响?例如,我是否有更多的“编码 1”与“编码 2”或“编码 3”的功能。为了清楚起见,我想使用回归而不是分类。
如果有任何材料可以阅读,请告诉我。