一个主题的训练集是否有助于预测任何其他主题的情绪?

数据挖掘 机器学习 分类 朴素贝叶斯分类器 情绪分析
2022-03-11 07:20:03

我正在从事 Twitter 情绪分析。现在,我应该准备一个适合任何类型的 Twitter 数据的训练数据集,这些数据将推文的情绪预测为 pos、neg 和 neu。

通过谷歌搜索,我发现了一个带有所需标签(pos、neg、neu 和情绪)的航空公司推文训练数据集。当我使用该训练数据集检查推文的情绪时,它给了我不同的结果。我发现一些积极的推文被认为是消极的,而消极的则是积极的。

我遵循的方法是否正确?

请提出您对准备可以预测任何类型的 twitter 数据的训练数据集的看法。

1个回答

由于您已经在航空公司推文上训练了模型,因此该模型将学习航空公司推文的特征。航空公司推文中可能使用的词语是积极的并且包含很大的权重,但甚至从未在其他推文中使用,从而导致负面结果。我建议你试试

  1. 获取一个数据集,其中包含您想要的各种推文,这些推文与您未来的任务基本相似。
  2. 研究迁移学习