我正在考虑两个任务:
- 对话行为文本分类(例如分类为:问题;意见;...)
- 从言语中识别情绪(例如快乐;平静;悲伤;...)
对于此类任务,哪种 DL 模型应该表现得更好?我计划使用 CNN,它应该对他们俩都有效,但不确定效果如何。我可以应用 LSTM 或其他一些方法吗?我以前用过 Keras。
对这两个任务应用注意力机制或其他一些方法是否很好?
我正在考虑两个任务:
对于此类任务,哪种 DL 模型应该表现得更好?我计划使用 CNN,它应该对他们俩都有效,但不确定效果如何。我可以应用 LSTM 或其他一些方法吗?我以前用过 Keras。
对这两个任务应用注意力机制或其他一些方法是否很好?
欢迎来到本站。我对您在此处收到的其他两个答案感到有些不安。听起来您正在跳过很多步骤并想直接进入建模 - 这是一个巨大的错误!
你是科学家!您的角色是创造尽可能公平、公正的环境,让数据与您对话(而不是相反!)。之前有效的方法(LSTM)可能是也可能不是这个全新数据集的最佳方法。因此,在完成 EDA 阶段之后,您应该对将要检查和测试的多个模型保持“开放式”视图,然后再决定继续使用哪个模型。答案甚至可能不是神经网络,它可能是一种完全不同的方法。
请对您的数据科学实践负责。您不能立即跳入建模领域。让数据说话。
您可以使用的典型模型如下所示 -
输入文本 -> 词嵌入 -> 双向 LSTM -> 密集输出层
词嵌入层——将词汇表中的词映射成实数向量。
双向 LSTM - 因为它们可以保存过去和未来的信息,所以与单向 LSTM 相比,它们可以更好地理解上下文。
查看以下链接以获取更多详细信息-
https://machinelearningmastery.com/what-are-word-embeddings/ https://machinelearningmastery.com/develop-bidirectional-lstm-sequence-classification-python-keras/