我正在从事 Twitter 情绪分析。现在,我应该准备一个适合任何类型的 Twitter 数据的训练数据集,这些数据将推文的情绪预测为 pos、neg 和 neu。
通过谷歌搜索,我发现了一个带有所需标签(pos、neg、neu 和情绪)的航空公司推文训练数据集。当我使用该训练数据集检查推文的情绪时,它给了我不同的结果。我发现一些积极的推文被认为是消极的,而消极的则是积极的。
我遵循的方法是否正确?
请提出您对准备可以预测任何类型的 twitter 数据的训练数据集的看法。
我正在从事 Twitter 情绪分析。现在,我应该准备一个适合任何类型的 Twitter 数据的训练数据集,这些数据将推文的情绪预测为 pos、neg 和 neu。
通过谷歌搜索,我发现了一个带有所需标签(pos、neg、neu 和情绪)的航空公司推文训练数据集。当我使用该训练数据集检查推文的情绪时,它给了我不同的结果。我发现一些积极的推文被认为是消极的,而消极的则是积极的。
我遵循的方法是否正确?
请提出您对准备可以预测任何类型的 twitter 数据的训练数据集的看法。
由于您已经在航空公司推文上训练了模型,因此该模型将学习航空公司推文的特征。航空公司推文中可能使用的词语是积极的并且包含很大的权重,但甚至从未在其他推文中使用,从而导致负面结果。我建议你试试