在“识别文本中的讽刺”领域做了哪些研究?

人工智能 自然语言处理 参考请求 自然语言理解 语义
2021-11-05 20:20:27

识别讽刺被认为是 ML 和 NLP/NLU 领域中最困难的开放式问题之一。

那么,在这方面是否进行过大量研究?如果是,那么准确度如何?另外,请简要解释一下 NLP 模型。

2个回答

来自 IIT Bombay 的研究人员的以下调查文章总结了讽刺检测的最新进展:Arxiv 链接

关于你的问题,我不认为它被认为是非常困难或开放的。虽然它确实引入了计算机无法处理的歧义,但人类很容易理解讽刺,因此能够标记数据集以进行讽刺检测。

最近在同一领域有一项工作,其中神经网络(准确地说是 CNN)用于相同目的。一些信息。关于研究是:

为了了解该上下文,该论文描述了一种神经网络查找用户“嵌入”的方法——即上下文线索,如先前推文的内容、相关兴趣和帐户等。它使用这些不同的因素将用户与其他人一起绘制,并且(理想情况下)发现他们形成了相对明确定义的组。

因此,本文使用 CNN、单词和用户嵌入来检测文本中的讽刺。还有一篇关于它的Techcrunch 文章

该论文使用了推文的情绪,并与其他类似推文的情绪进行了比较:

如果推文的情绪似乎与类似用户表达的大部分内容不一致,那么很有可能是在使用讽刺。

链接到论文