基于词典的情感分析中的词权重

数据挖掘 nlp 情绪分析 nltk
2022-02-28 17:06:21

我有一个关于我当前项目的问题,我正在尝试对我的数据进行基于词典的情感分析,我计算情感分数如下:

Score=iwordiwords

因此,根据分数,单词将被分类为负数或正数。但我也计算了文章中每个单词的显着性和频率,并想知道是否可以在我上面的情绪分析公式中使用它们。

 words| salience| frequence
 sad    0.8       3
 happy  0.5       2
1个回答

是的你可以。不太确定还要添加什么。您的公式可能如下所示:

Score=if(saliencei,frequencyi,sentimenti)

其中是一个函数,它用显着性和频率来衡量你的情绪得分。由你来定义如何。f

  • 如果您不知道使用哪个怎么办?f

现在,请耐心等待,这本身不是我尝试过的,但这可能是一种有趣的方法。您可以使用循环神经网络,您的输入可以是每个单词的显着性、频率和情感分数。您的 RNN 不仅会为您的特定问题“创建”(理想情况下)最佳,而且还会使用单词的顺序信息,这甚至可以改善您的结果。f