我正在尝试通过尝试一些问题来学习数据分析和机器学习。
我发现了一个竞赛“房价”,它实际上是一个操场竞赛。由于我对这个领域很陌生,在探索数据后我感到困惑。数据有 81 列,其中 1 列是目标列,即房屋价值。此数据包含多个列,其中大多数值为“NaN”。当我跑的时候:
nulls = data.isnull().sum()
nulls[nulls > 0]
这显示了缺少值的列:
LotFrontage 259
Alley 1369
MasVnrType 8
MasVnrArea 8
BsmtQual 37
BsmtCond 37
BsmtExposure 38
BsmtFinType1 37
BsmtFinType2 38
Electrical 1
FireplaceQu 690
GarageType 81
GarageYrBlt 81
GarageFinish 81
GarageQual 81
GarageCond 81
PoolQC 1453
Fence 1179
MiscFeature 1406
在这一点上,我完全迷失了,我不知道如何摆脱这些“NaN”值。
任何帮助,将不胜感激。