我在 scikit-learn 将数据帧转换为 numpy 数组时遇到问题。
例如下面的代码
from sklearn.impute import SimpleImputer
import pandas as pd
df = pd.DataFrame(dict(
x=[1, 2, np.nan],
y=[2, np.nan, 0]
))
SimpleImputer().fit_transform(df)
退货
array([[1. , 2. ],
[2. , 1. ],
[1.5, 0. ]])
有没有办法使用返回 pandas 数据框而不是 numpy 数组的 imputer?是否有 scikit-learn 实现?我知道sklearn-pandas,但界面有点不同。