我应该如何评估写作质量以根据内容比较两篇文章(哪篇文章更适合/针对某个主题编写)?

数据挖掘 机器学习 nlp 余弦距离
2021-09-18 17:28:33

我正在尝试建立一个平台,该平台可以在互联网上发现的有关某些特定“主题”的许多文章中综合质量内容,该算法应该能够推荐互联网上有关该主题的前 10 篇文章。应该使用什么算法和方法来评估写作质量,并在“来源可信度”等许多其他参数上给出某种评分。我负责抓取和查找内容,寻找算法和方法来评估它。请建议相同的资源(课程,研究论文等)。

1个回答

互联网文章的“来源可信度”最好通过Page Rank算法计算。

用算法确定写作质量可能是棘手的。然而,页面排名可能是一个代理。如果一篇文章是一个中心,那么它就是该主题的权威,并且可以被认为写得很好(或至少非常有用)。