从文本/语音中选择哪个神经网络进行分类?

数据挖掘 神经网络 深度学习 lstm 美国有线电视新闻网 nlp
2022-02-22 23:35:24

我正在考虑两个任务:

  • 对话行为文本分类(例如分类为:问题;意见;...)
  • 从言语中识别情绪(例如快乐;平静;悲伤;...)

对于此类任务,哪种 DL 模型应该表现得更好?我计划使用 CNN,它应该对他们俩都有效,但不确定效果如何。我可以应用 LSTM 或其他一些方法吗?我以前用过 Keras。

对这两个任务应用注意力机制或其他一些方法是否很好?

3个回答

欢迎来到本站。我对您在此处收到的其他两个答案感到有些不安。听起来您正在跳过很多步骤并想直接进入建模 - 这是一个巨大的错误!

你是科学家您的角色是创造尽可能公平、公正的环境,让数据与您对话(而不是相反!)。之前有效的方法(LSTM)可能是也可能不是这个全新数据集的最佳方法。因此,在完成 EDA 阶段之后,您应该对将要检查和测试的多个模型保持“开放式”视图,然后再决定继续使用哪个模型。答案甚至可能不是神经网络,它可能是一种完全不同的方法。

请对您的数据科学实践负责。您不能立即跳入建模领域。让数据说话。

您可以将一维卷积RNN(如 LSTM)用于文本分类任务。很难说哪个更好,因为它取决于你的神经网络和数据集结构。

从您的数据集中抽取一个较小的样本,然后训练和评估两个网络。选择最好的模型。在此模型上使用更大的数据进行训练。我认为最方便的方法是这个。

我建议你阅读这篇文章和这篇文章,以了解 LSTM 的工作原理以及你可以用它做什么。有一些示例和用例。确定它是否适合您的数据。

您可以使用的典型模型如下所示 -

输入文本 -> 词嵌入 -> 双向 LSTM -> 密集输出层

词嵌入层——将词汇表中的词映射成实数向量。

双向 LSTM - 因为它们可以保存过去和未来的信息,所以与单向 LSTM 相比,它们可以更好地理解上下文。

查看以下链接以获取更多详细信息-

https://machinelearningmastery.com/what-are-word-embeddings/ https://machinelearningmastery.com/develop-bidirectional-lstm-sequence-classification-python-keras/