将一页内容缩减为一小段

数据挖掘 文本挖掘
2022-02-11 16:36:29

我记得几年前,雅虎详细介绍了他们如何能够将网页缩减为简短的文本段落,以句子形式简洁地总结内容,而不是关键字列表。这个叫什么?是否有任何开放/免费代码可以做到这一点?

1个回答

查看 TextRank 算法,这是论文你可以在这里找到一个简洁的 python 实现textrank implementation如果我没记错 gensim 也提供了一个实现。