我将把酒店评论分为正面、负面和中性。为了训练模型,我找不到任何带有正、负和中性标签的数据集。我可以找到这个Hotel Reviews 数据集,但它只包含正面和负面标签。因此,我决定创建带有正面、负面和中性标签的新训练数据集。决定我认为使用评级数字的标签。这是个好主意还是坏主意?一些专家可以就问题提出一些建议,因为我是这个领域的新手。
创建新数据集
数据挖掘
机器学习
数据集
机器学习模型
2022-02-24 06:15:49
1个回答
当然可以,但为什么不尝试直接预测评分呢?
除非您对正面、中性、负面 3 个类别有特定需求,否则没有理由不使用提供的评级,因为它也代表了评论的情绪。
请注意,这将是一项回归任务,因为您预测的是一个数字(与预测分类变量的分类任务相反)。
其它你可能感兴趣的问题