用于检测文本输入是否为问题的现有预训练 NLP 模型

数据挖掘 Python nlp 迁移学习
2022-03-10 16:16:11

我想快速将文本数据过滤成问题和非问题。在文本中使用问号的存在太粗暴了。是否有任何现有模型可以用来帮助我完成任务?

1个回答

Stack Overflow 上有多个线程在讨论这个问题。可以在下面找到几个示例:

你也可以看看Natty它是 Stack Overflow 上的一个机器人,用于审查旧问题的答案。您可以看到它在检测问题方面的有效性(每个机器人都需要培训,而 Natty 已经接受了相当长的培训)。然而它是用 Java 编写的,它可能会给你一些想法。就像在检查是否存在问号的同时检测关键字一样。