我正在做一个 nlp 情绪检测项目。我试图预测的情绪是“快乐”、“恐惧”、“愤怒”、“悲伤”。我使用一些公开可用的标记数据集来训练我的模型,例如 ISEAR、WASSA 等。我尝试了以下方法:
- 传统的 ML使用二元组和三元组进行处理。
- 具有以下架构的CNN:(X)文本 -> 嵌入(W2V 在维基百科文章上预训练)-> 深度网络(CNN 1D)-> 全连接(密集)-> 输出层(Softmax)-> 情感类(Y)
- 具有以下架构的LSTM:(X)文本 -> 嵌入(W2V 在维基百科文章上预训练)-> 深度网络(LSTM/GRU)-> 全连接(密集)-> 输出层(Softmax)-> 情感类(Y)
NN 模型达到了 80% 以上的准确率,但是当我使用经过训练的模型来预测包含一些否定的文本上的情绪时,我得到了错误的结果。例如:
文本:“我对easy jet 很满意,这是一家很棒的公司!”
预测快乐
文字:我对易捷航空不满意 #unhappy_customer
预测快乐
关于如何克服这个问题的任何建议?