我目前正在使用 Python 进行情绪分析。我想根据情绪分析来确定对电影的评论是正面的还是负面的。我找到了此链接中提供的训练数据集。
这个数据集有评论,1 表示评论是正面的,0 表示电影评论是负面的,但它的记录数较少。我有一个测试数据集,我将根据训练集进行预测。我的测试数据集包含复杂而长的单词,我的 python ML 模型有时会给出负面评论的正面结果(返回结果为 1 表示负面评论)。我正在寻找更好的数据集来训练我的模型,以便我的模型可以很好地预测。您能否建议我在这种情况下使用任何好的/大而有效的训练数据集?如果您可以分享任何链接,那就太好了。训练数据的格式可以是 1 表示正面评论,0 表示负面评论,甚至像 pos 这样的极性表示正面评论或 neg 表示负面评论。