我正在尝试开发一个 NLP 模型,它需要类似you have high levels of cholesterol
(这将是一个标签)作为输入,并且必须输出类似you have high levels of cholesterol, you need to have a low-salt diet that emphasizes fruits, vegetables and whole grains; limit the amount of animal fats and use good fats in moderation
(这将是建议;这是医生的示例建议)。
所以,现在当我研究如何实现这一点时,我偶然发现了这篇研究论文,我从中学到了一些东西paraphrase extraction
,而且我需要建立一个带有标签和建议的平行语料库。
我想在 Python 中做到这一点。我在互联网上找不到太多关于如何在 Python 中完成释义提取的信息,但是有很多文章谈论释义检测和其他事情。
那么,我们在 Python 中是否有任何用于此目的的库(感谢任何形式的帮助)?
我如何为同样的目的建立语料库?