我有一堆用户输入的职位描述。有各种各样的拼写错误和错误的数据。IE:
...
tulane univ hospital
tulip
tullett prebon
...
weik investment
weill cornell university medical center
weis
weiss waldee hohimer dds
welded constrction l.p.
welder
welder
welder
...
您将采取哪些步骤来通过与工作相关的见解来“增强”这些价值观?
我能想到的最好的办法就是把它交给 wolfram alpha。但我想知道是否还有其他可以使用 python 的可访问技术。
更新:我发现有一个标准职业分类,我真的很想将名称与 SOC 匹配,并将 SOC 与一系列平均工资匹配。