我正在训练基于社交媒体数据的 SVM 模型进行情绪分析,例如。推文。
该模型将使用一小部分特定公司的推文进行训练,以便对新推文进行分类。然而,由于训练集太小而无法获得准确的模型,我将把公司的数据与更大的通用推文数据集相结合来训练模型。
专门针对一家公司,各个数据的内容与一般数据集的内容略有不同。由于要预测的数据是公司专业的,所以在我看来,将模型训练偏向于更加重视与公司相关的推文以提高准确性似乎是合乎逻辑的。我的第一个想法是简单地增加公司推文的极性大小,例如,一般推文为 -1 或 1,公司推文为 -3 和 3。
这是正确的想法/方法吗?