我在一个文本文件中有一堆 URL,例如-
https://www.mycustomer.com/marketing/technology/how-marketers-are-over-simplifying-b2b-buyer-behaviour
https://www.forbes.com/sites/forbesagencycouncil/2018/09/06/how-to-use-content-marketing-to-boost-your-recruiting-efforts
https://www.forbes.com/sites/forbesagencycouncil/2017/02/03/video-marketing-the-future-of-content-marketing
https://www.searchenginejournal.com/seo-content-marketing-strategy/258253
...
从这些 URL 中提取前 10 个关键字的最佳方法是什么(不解析网页)?
我知道 TF-IDF 但这通常需要 atitle和 a body,我还能在这里使用它吗?或者是否有任何其他方法(例如 TextRank)可以在这里更好地工作?