我有一个以学校名称作为列之一的熊猫数据框。但是,学校名称中有很多拼写错误,例如:
“Abernethy Elem 学校”、“Abernethy 小学”、“BOISE/ELIOT ELEM SCHOOL”、“Boise/Eliot 小学”、“Boise-Eliot 小学”......
我正在尝试通过这样做来清理名称:
school_perf_report["SCHLNM"] = school_perf_report["SCHLNM"].str.lower().str.replace(r"elementary","elem").str.replace(r"/"," ").str.replace("-"," ").str.replace(r"\s+"," ")
有没有更简洁的方法来执行相同的操作?基本上
- 将“基本”更改为“elem”
- 删除 / 或 - 并用空格替换它们。
- 删除多个空格
- 全部小写
谢谢