例如,在以下两条推文中,我们可以看到第一条似乎比第二条更负面:
“你现在不用过来!!!”
“你现在不需要过来”
有哪些方法可以统计感叹号的效果,以便我们得到更好的结果?
在以下推文中:
“他很生气!!!”
我们可以保持“生气”两次,即推文变成:
“他生气生气了。”
因此,假设我们使用正/负频率模型进行情绪分析,那么“愤怒”这个词更有可能被认为是负面的,因为它在负面推文中的频率更高。
例如,在以下两条推文中,我们可以看到第一条似乎比第二条更负面:
“你现在不用过来!!!”
“你现在不需要过来”
有哪些方法可以统计感叹号的效果,以便我们得到更好的结果?
在以下推文中:
“他很生气!!!”
我们可以保持“生气”两次,即推文变成:
“他生气生气了。”
因此,假设我们使用正/负频率模型进行情绪分析,那么“愤怒”这个词更有可能被认为是负面的,因为它在负面推文中的频率更高。
标记时,将感叹号分开并保留。然后使用基于计数的矢量化来创建带有出现次数的感叹号特征。
然后,该模型将有机会学习权衡感叹号的频率如何影响正面/负面情绪。
这实际上取决于您用于分类的模型,或者更好地用于句子向量化。你当然可以为感叹号添加一个特殊的标记,以使模型明白你的第一句话比第二句话差。