我正在处理以下类型的分类问题:我必须使用实例的许多图像将每个实例分类为 A 类或 B 类。也就是说,每个训练实例都不是一张图像(这是图像分类中常见的事情),而是很多图像,并且每个训练实例的图像数量不是固定的。也就是说,实例 1 可以有 3 张图像,根据这些图像我们必须将其分类为 A 或 B,而实例 2 可以有 5 张图像。
与任何机器学习问题一样,我得到了许多标记的图像,我必须构建一个分类器。
尽管也欢迎提出想法,但我正在寻找一种记录在案的方法来解决这类问题(主要是 Kaggles、论文或书籍)。
我的主要想法如下:训练模型 给定一张图像给出该图像属于 A 类的概率。然后,对于每个训练实例,评估 在实例的每个图像中,并计算这些概率分布的统计数据(聚合),作为平均值、中值、最大值和最小值。然后,训练一个模型 将这些聚合作为输入并使用 ,聚合和 作为最终模型。这个想法有点简单,所以我正在寻找更好的东西。