使用机器学习提取网页数据

数据挖掘 机器学习 Python nlp
2021-09-25 19:34:01

我想从网页中提取一些特定信息。网页包含个人资料,我想提取姓名、电子邮件、研究兴趣领域等信息。每个页面的结构彼此不同。如何使用机器学习提取此类信息?我可以使用什么样的方法、功能?

或者我可以使用 NLP 来完成这样的任务吗?

1个回答

如果我正确理解了您的问题,这似乎是一个抓取问题,您可以在 python 中使用 Beautifulsoup 来完成。