我有一个显微镜图像数据集,我想训练一个 ML/DL 算法来执行二进制分类。正类是图像中只有一个细胞,而负类是其他所有细胞(即当有超过 1 个细胞或根本没有细胞时)。
下面是原始图像之一。(图像中心的弯曲部位有一个单元格)
由于图像尺寸大(2048x2048)和信息过多(细胞只能在管系统中),我决定对它们进行预处理。因此,我将管系统外的所有内容都设置为 0(黑色),然后通过对整个数据集的图像进行平均来将所有图像裁剪到我得到的边界。您可以在下面看到最终结果。(管内有2个细胞,1个在中心,1个在左上角)
然后我尝试训练一个 CNN(使用 python 和 TensorFlow)。我通过改变它的超参数玩了几次,但我没有运气。我认为问题在于细胞(感兴趣区域)占据了图像的一小部分,这使得算法很难集中注意力。更糟糕的是,周围有随机的灰尘颗粒,使图像嘈杂。
您对我如何在这样的数据集中执行稳健的二进制分类有任何想法吗?