句子转换和一致性的技术

人工智能 自然语言处理 计算语言学
2021-10-26 01:17:57

我正在寻找 NLP 技术来转换句子而不影响它们的含义,以及文本一致性的措施。例如,可以将主动语态转化为被动语态的技术,例如

猫在追老鼠。

老鼠被猫追了。

我可以想到一些可以实施的启发式方法来使这种情况发生在特定情况下,但我会假设在语言学或 NLP 领域已经对此进行了研究。我对“句子转换”和类似术语的搜索并没有带来任何东西,我想知道我是否只是有错误的搜索词。

与此相关,我也在寻找文本一致性的度量,例如,一种可以检测语料库中的大多数句子是用主动语态书写并检测以被动语态书写的异常值的方法。我在这里使用主动与被动语态作为示例,并且会对更通用的方法感兴趣。任何指针将不胜感激,谢谢!

1个回答

严格来说,这是不可能的。改变句子的形式也会改变它的意思。即使是主动-被动也很重要,因为您会用它来强调重要的事情:猫在做什么是相关的,还是与老鼠发生的事情更相关?诚然,纯命题意义不受此影响,但这只是句子意义的一个组成部分。

传统语言学已经有很多关于句子形式的工作。你可以看看Noam Chomsky的开创性著作之一《句法结构》,他在其中介绍了后来导致转换语法的概念。这影响了许多后续的语言学方法,但据我所知,转换不再是语言学的重点。

对于您的第二个问题,风格一致性,您可以查看 Douglas Biber 的作品。他的著作《语音和写作的变化》介绍了许多(易于提取的)语言特征,您可以使用这些特征来量化一致性。