我可以使用预训练模型对未标记数据进行情感分析/文本分类吗?

数据挖掘 机器学习 分类 nlp 文本挖掘 情绪分析
2022-02-18 22:00:34

我正计划开展一个项目,在那里我将收集大量关于冠状病毒疫苗的推文。所有推文都没有标签(例如正面、中立、负面)。因此,我将无法根据标签训练模型。

我对 BERT 或 VADER 等预训练模型的理解很模糊。但是我不知道我是否可以使用在其他(文本)数据(如上面提到的数据)上训练的模型,并使用它对我拥有的推文进行情绪分析。

是否有可能做到这一点?或者它是否需要标记数据才能使用与疫苗推文相关的特定数据来训练模型?

1个回答

您至少需要一些标记的疫苗推文(正面、中性、负面)来训练 BERT 模型,以便它开始理解该领域。

对于 VADER,您不需要任何标记数据。

然而,当我们比较准确率时,BERT 模型总是表现得更好。