我想对我抓取的大型文本数据集进行一些情绪分析。根据我目前所学到的知识,我知道我需要手动标记每个文本数据(正面、负面、中性),或者使用预训练的模型,例如 bert 和 textblob。
我想知道哪个模型在情感标签方面的准确性最高。双极(正极,负极)和三极(正极,中性,负极)都可以用于我想做的分析。
如果我想制作自己的模型来标记每个文本的情绪,我是否必须手动将它们全部手动放置,或者有没有办法可以标记一些文本行,并将它们放在训练中以找出其余的每个情绪?如果有的话,我想知道我可以进一步研究的名字。
谢谢!