使用 RandomForest 模型预测测试数据时出现 ValueError。
我的代码:
clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2)
clf.fit(X_fit, y_fit)
df_test.fillna(df_test.mean())
X_test = df_test.values
y_pred = clf.predict(X_test)
错误:
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
如何在测试数据集中找到错误的值?另外,我不想删除这些记录,我可以用平均值或中位数替换它们吗?
谢谢。