有哪些方法可以加快模型在大文件(超过 200 mb)上的拟合速度?我尝试过分块(块)或使用 dask 但效果并不理想。我使用 16GB RAM 和 i7 2.2GHz 处理器 4 核。仍然是购买云服务还是使用更好的计算机?我的分类器
clf = xgb.XGBClassifier(n_estimators=500,
n_jobs=4,
max_depth=9,
learning_rate=0.05,
subsample=0.7,
colsample_bytree=0.7,
missing=-999,
gamma = 0.1)
# Number of variable > 400
# Number of rows > 200000