我正在处理特朗普和拜登辩论的记录,想分析句子并对负面、正面或中性评论进行分类,但遇到了一个问题。我使用 TextBlob 和 transformers 管道来分析情绪,但不幸的是,在这两种方法中,都存在一些非常灾难性的缺陷!
例如,我发现 TextBlob在“每天有更少的人死去”(负面评论)中识别出-0.70 极性
或变形金刚管道识别“大厅里的观众已承诺保持沉默。” 作为0.99% 肯定的负面评论!
为什么你认为它正在发生?我们有什么办法可以防止这种情况发生吗?有没有比这更好的方法来分析未标记文本的情绪?
另外,我对“哦,真的?!”这样的句子感到不舒服。被归类为中立。我认为这更像是一种讽刺或负面的评论。
这是我的colab 笔记本,我在观察这些示例的地方添加了一个“问题”降价。