数据挖掘 - 从文本/语音中选择哪个神经网络进行分类？ - 吾爱随笔录

从文本/语音中选择哪个神经网络进行分类？

数据挖掘神经网络深度学习 lstm 美国有线电视新闻网 nlp

2022-02-22 23:35:24

我正在考虑两个任务：

对话行为文本分类（例如分类为：问题；意见；...）
从言语中识别情绪（例如快乐；平静；悲伤；...）

对于此类任务，哪种 DL 模型应该表现得更好？我计划使用 CNN，它应该对他们俩都有效，但不确定效果如何。我可以应用 LSTM 或其他一些方法吗？我以前用过 Keras。

对这两个任务应用注意力机制或其他一些方法是否很好？

3个回答

欢迎来到本站。我对您在此处收到的其他两个答案感到有些不安。听起来您正在跳过很多步骤并想直接进入建模 - 这是一个巨大的错误！

你是科学家！您的角色是创造尽可能公平、公正的环境，让数据与您对话（而不是相反！）。之前有效的方法（LSTM）可能是也可能不是这个全新数据集的最佳方法。因此，在完成 EDA 阶段之后，您应该对将要检查和测试的多个模型保持“开放式”视图，然后再决定继续使用哪个模型。答案甚至可能不是神经网络，它可能是一种完全不同的方法。

请对您的数据科学实践负责。您不能立即跳入建模领域。让数据说话。

您可以将一维卷积和RNN（如 LSTM）用于文本分类任务。很难说哪个更好，因为它取决于你的神经网络和数据集结构。

从您的数据集中抽取一个较小的样本，然后训练和评估两个网络。选择最好的模型。在此模型上使用更大的数据进行训练。我认为最方便的方法是这个。

我建议你阅读这篇文章和这篇文章，以了解 LSTM 的工作原理以及你可以用它做什么。有一些示例和用例。确定它是否适合您的数据。

您可以使用的典型模型如下所示 -

输入文本 -> 词嵌入 -> 双向 LSTM -> 密集输出层

词嵌入层——将词汇表中的词映射成实数向量。

双向 LSTM - 因为它们可以保存过去和未来的信息，所以与单向 LSTM 相比，它们可以更好地理解上下文。

查看以下链接以获取更多详细信息-

https://machinelearningmastery.com/what-are-word-embeddings/ https://machinelearningmastery.com/develop-bidirectional-lstm-sequence-classification-python-keras/

其它你可能感兴趣的问题

上一篇如何为两个不同的推荐系统选择随机数据？下一篇回归损失函数为nan