我正在寻找 NLP 技术来转换句子而不影响它们的含义,以及文本一致性的措施。例如,可以将主动语态转化为被动语态的技术,例如
猫在追老鼠。
到
老鼠被猫追了。
我可以想到一些可以实施的启发式方法来使这种情况发生在特定情况下,但我会假设在语言学或 NLP 领域已经对此进行了研究。我对“句子转换”和类似术语的搜索并没有带来任何东西,我想知道我是否只是有错误的搜索词。
与此相关,我也在寻找文本一致性的度量,例如,一种可以检测语料库中的大多数句子是用主动语态书写并检测以被动语态书写的异常值的方法。我在这里使用主动与被动语态作为示例,并且会对更通用的方法感兴趣。任何指针将不胜感激,谢谢!