是否有可能根据他们所写的内容来识别一个人?

人工智能 自然语言处理 参考请求 计算语言学
2021-10-21 07:01:11

我需要创建一个基于数百个文本识别人的系统,方法是在他们的书面文本中发现语法上的相似性或他们选择写作的单词之间的相似性。我不希望它那么准确,但我想知道它是否可能。

例如,在论坛上找到一个拥有两个或更多帐户的人,或者在这种情况下(已经收集了文本)。我只是想知道这是否可能以及我应该研究什么领域。

1个回答

您正在寻找的术语是stylometry,它与法医语言学中称为writeprint 分析的技术有关。有许多不同的技术可以进行文体分析,从非常基本的 5 特征分析分类特征(例如一个人独有的词汇和特质)到利用神经网络和机器学习的更复杂的分析。在线搜索以文体测量为重点的研究论文应该可以帮助您找到最适合这项工作的技术。