判断是否可以从段落中回答问题的方法

人工智能 神经网络 机器学习 分类 自然语言处理
2021-10-23 08:18:04

我正在使用 SQuAD 数据集开展与机器问答相关的项目。我已经实现了一个神经网络解决方案,用于在提供的上下文段落中寻找答案,但是当给出无法从上下文中回答的问题时,系统(显然)会遇到困难。它通常会产生荒谬且实体类型错误的答案。

是否有任何现有的研究可以使用上下文段落中的信息来判断一个问题是否可以回答?或者生成的答案是否有效?我考虑了文本蕴涵,但它似乎并不完全是我正在寻找的(尽管也许我错了?)

1个回答

这个问题非常具有挑战性,因为您需要评估候选答案的质量。

在问题回答中,您需要遵循一些常见步骤。总结一下,你首先需要找到可以回答问题的句子,然后组成最终答案。

在第一步中,您可以测量 Q 和 A 之间的语义相似性,这是您可以使用多种深度学习方法的第一个过滤器。此外,您可以定义一个阈值来验证对 QA 是否足够相关。

第二步,你必须提取答案,如果答案是事实你可以使用知识库提取,或者如果是摘要,列出你可以使用其他DL方法。还有可能你必须推断答案,也适用于 DL 方法。

我建议检查这篇论文:

迈向 AI 完整问答:一组必备玩具任务