我正在研究社交媒体上的情绪分析,特别是将博客文章等在线文本分类为正面、负面或中性。
我发现的大多数情绪分析方法都是有监督的(它们需要标记数据来训练分类器)。但是,我还发现了几篇论文,它们使用像这样的联合主题情绪模型(无监督)来做到这一点。
根据主题模型论文中的结果,基于主题模型的无监督方法的主要优点是它们不需要任何标记数据(除了先前的“一般”情感信息,即积极/消极词的字典)。但是,它们没有达到监督方法的准确性(准确性降低 2%)。
使用主题情感模型而不是监督方法进行情感分类还有其他优点/缺点吗?
谢谢。