AlexNet CNN 如何应用于我的案例?

数据挖掘 美国有线电视新闻网 多类分类 亚历克斯网
2021-09-27 07:07:07

我正在从事我去年的项目,在那里我获得了数字化的 WSI(全幻灯片图像),尽管它们在 1390x1040 大小左右相当小(这是不寻常的)。这些图像是用 Ki-64 指数染色的多形性胶质母细胞瘤(脑癌)病例,这导致我认为恶性部位被标记为棕色。这是我正在查看的一个小例子。 其中一张图片的片段

简单来说,我的目标是计算蓝色和棕色细胞(增殖指数的估计),这基于我的研究是一个分割问题。我还得出结论,AlexNet 是用于此目的的成功架构。然而,我遇到的麻烦是这些数据没有标记,作为一名 Comp Sci 学生,我认为我没有足够的专业知识来注释基本事实值。我的问题归结为这一点,我应该探索任何替代方法,还是应该完全放弃这个数据集?

4个回答

您可以做的可能是使用具有 3 种模式的 GMM 将图像聚集到 3 个“分区”中。第一个包含蓝色的所有像素,第二个包含棕色的所有像素,最后一个应该包含背景像素。您将根据原始 RGB 值进行聚类(除非您可以为要聚类的每个像素计算更多基于语义的深度学习特征)。然后,您将对分配给 3 种模式中的每一种的像素进行某种形式的颜色采样,以确定哪些是棕色斑点,哪些是蓝色斑点。您可以通过计算 GMM blob 中的二进制图像轻松计数。

AlexNet(以及 VGG、RestNET 和其他 RNN)是监督学习方法,因此您需要一个标记数据集才能继续。

在您的情况下,您似乎没有标签,所以我认为您不能使用这种方法。您可能想研究无监督学习技术。

当然,另一种选择是找到一个给定任务的标记数据集,我会推荐。

您可以尝试几件事。

  • 首先,使用像这样的标记工具手动标记数据集,您可以在所有标记周围绘制框并为其分配标签。然后你可以训练一个 YOLO 风格的检测器来进行目标检测。这种方法起初可能是劳动密集型的,但后来相当自动化。

  • 另一件事是创建一个带有掩码的简单检测器,您可以在 RGB 图像的 R(ed) 通道上设置一个阈值来分割您的图像并找到红色/棕色标记。然后,您可以训练一个回归模型(Alexnet/VGG 等),例如将图像中红色/棕色标记像素的总数作为您的目标(蓝色像素相同)。根据领域知识,您也许可以通过这种方式创建类,例如如果红色像素 > 500 则为恶性图像。

这个问题(除非我遗漏了一些重要的东西)的结构使它成为更简单的无监督图像处理/计算机视觉技术的候选者。事实上,它只是简单地计算图像中的两种颜色/色调,棕色和蓝色。

因此,您可以使用非常有效的图像处理技术将图像划分为基于颜色/色调的连接组件(您可以对图像进行预处理,例如通过应用模糊过滤器和/或形态过滤器以覆盖区域中的小孔应该是具有该颜色的一个区域)。

然后简单地计算标记为蓝色的(连接的)组件和标记为棕色的组件。

注意:如果存在颜色变化(例如棕色因外部条件等而变化),那么在该技术之上,您可以应用 GMM 之类的概率模型将各种棕色和蓝色聚集在两个不同的集群中,然后再次计算棕色和蓝调。

你有它。不需要标记图像和训练深层等等。