情感分析中如何考虑感叹号的作用

数据挖掘 Python nlp 情绪分析
2022-02-16 11:46:27

例如,在以下两条推文中,我们可以看到第一条似乎比第二条更负面:

  1. “你现在不用过来!!!”

  2. “你现在不需要过来”

有哪些方法可以统计感叹号的效果,以便我们得到更好的结果?

在以下推文中:

“他很生气!!!”

我们可以保持“生气”两次,即推文变成:

“他生气生气了。”

因此,假设我们使用正/负频率模型进行情绪分析,那么“愤怒”这个词更有可能被认为是负面的,因为它在负面推文中的频率更高。

2个回答

标记时,将感叹号分开并保留。然后使用基于计数的矢量化来创建带有出现次数的感叹号特征。

然后,该模型将有机会学习权衡感叹号的频率如何影响正面/负面情绪。

这实际上取决于您用于分类的模型,或者更好地用于句子向量化。你当然可以为感叹号添加一个特殊的标记,以使模型明白你的第一句话比第二句话差。