带有情感分析的迁移学习?

数据挖掘 词嵌入 情绪分析 nlp
2022-03-10 05:20:10

问题是当情绪分析模型在不同的数据集上进行测试而不是训练时,需要记住哪些事情。

假设任务是对产品评论(未标记的数据集)执行情感分析 - 对正面、负面或神经进行分类。由于数据未标记,因此可以在类似的标记数据集(例如电影评论或产品评论)上训练模型(可能使用逻辑回归或 NN)并在原始未标记数据集上进行测试。

这样的事情会起作用吗?因为出现在未标记数据集中的产品名称的单词不会是模型在训练期间暴露的单词,所以在测试期间这些单词是否可能会甩掉模型?

1个回答

我无法完全回答您的问题,但想在此提供一些我的想法:1)鉴于从一个主题中学到的知识可能不够广泛或不够笼统,无法在目标或下游任务。例如,我最近使用 Twitter 航空公司客户评论数据训练了一个神经网络和 Word2Vec 嵌入,并获得了 77% 的预测准确率。然而,当我使用相同的 Word2Vec 和神经网络对一些一般的客户评论数据进行分类时,我得到的预测准确率只有 35%。

2)自然语言处理中的迁移学习是一个热门话题,最近许多研究人员都在研究它。2018年迁移学习有一些突破,比如Google Universal Sentence Encoder、BERT算法等。我也在学习,这里不能给大家一一列举。我建议您深入阅读一些博客文章,甚至是原始研究文章,以获得更好的理解。

愿它有所帮助。