我正在使用一个在产品评论中有 5 个数据集(A、B、C、D 和 E)的语料库,我的是一个文本分类问题,我需要找到分类性能方面最好的 5 个顶级模型(F1)。
我从集合 A:mp3 评论开始,因为它的文档数量最多(900:是,750:否)。
我使用不同的算法和预处理任务使用 10-fCv 训练数据,得到所有实验的加权结果。
我选择了前 5 个模型,我想将它们应用到语料库的其余部分:B、C、D 和 E(其他产品的评论)。
我的计划是运行 10-fCv 并获得所有集合的结果并计算精度、召回率和 F1 的微平均值。
这是为大型系列选择模型的正确方法吗?