我正在做一个 Kaggle 挑战,数据中的很多条目都是 NA。但是,根据数据描述,这实际上并不意味着“缺少数据”,它意味着“不适用”之类的东西,从某种意义上说,它只是没有那种质量(例如,没有地下室)。
但是,当我使用 pandas 使用 read_csv() 导入数据,然后使用 head() 查看它时,它会显示所有应该为 NA 的东西的 NaN(与 LibreOffice 中的电子表格相比)。
我知道如何将给定列的一个值替换为另一个值,但仍然存在问题。如果只有一个缺失值,通常应该输入 NaN。所以,如果它同时导入“NA”和一个空白单元格作为 NaN,我不知道它是哪个。
这可能不是一个大问题,因为无论如何我可能想用常见的东西替换实际的缺失值,但很高兴知道。我知道我也可以使用常规 python 进入 csv 并重命名那些实际的“NA”,但这很麻烦。有没有办法可以将某些列作为字符串导入?