ML/DL 能解决我的分类问题吗?

人工智能 机器学习 深度学习 分类
2021-10-26 02:38:52

我是 AI 新手,但仍想尝试启动一个项目。过去几天我读了很多关于 ML/DL 的文章,但我就是不知道我的问题是否可以用 ML/DL 解决。我正在尝试做的事情对我来说看起来像是分类工作,但也许不是。

我有 100 张压实土壤样本的图像,在这些图像上可能有多层可见。我将在下面附上一张图片,这个样品上有一个贴纸,通常他们没有。在图像上有 3 层,在贴纸的上方和下方分开。对于每张图像,都有关于层大小和该层土壤类型的数据(xml 文件),这需要花费大量时间来生成,所以我想在未来自动进行这种分类。数据文件包含如下信息:

layer0:
    type 004
    2cm
    12cm
layer1:
    type 003
    12cm
    25cm

如果只有一层,人工智能可以了解这些层的样子,并将它们分类到正确的土壤类别中。但我不知道我的问题是否可以用 AI 解决,因为一张图像上可能有 1、2、3 或 4 个不同的层(类),我还没有看到任何分类示例,其中可以有多个类一张图片。由于 AI 是一个相当陡峭的学习曲线,我想知道我的问题是否适合 ML/DL,然后再花更多的时间阅读可能不起作用的东西。我已经阅读了许多网站和一些短书,但找不到我的问题的答案。

ML/DL 能否解决我的多类单图像分类问题,我应该阅读哪种策略?

在此处输入图像描述

1个回答

关于图像分类器在理论上是否可以执行任务的简单完整性检查是:

人类专家可以使用相同的图像加上他们熟悉的类别列表来执行相同的任务吗?

重要的是,您考虑图像的内容(或者通常是您准备提供给分类器的数据)和专家的一般知识。例如,不允许专家收集更多数据,或与样本交互,除非对像素进行一些测量。

这个健全性检查并不能告诉你问题有多难。它也确实排除了对人类来说非常困难或不可能但对计算机来说实际上很容易的问题。然而,这是一个好的开始,因为如今单一用途的计算机视觉分类器任务的评分通常与执行相同任务的人类相似或更好。您正在有效地检查“我需要用于推理的数据实际上是否在图像中?”

多类分类器有多种可能。一种方法是让神经网络有单独的头来对每一层进行分类,并且可能一个层呈现二进制标志以允许不同数量的层。这类似于称为 YOLO 的体系结构,该体系结构将 0 或 1 个对象及其在图像中多个网格正方形上的位置分类。您的架构需要与 YOLO 不同,但您可以使用其中的很多想法,例如输出具有多个多类分类器的输出,每个土壤层一个。

我有 100 张压实土壤样本的图像

您将面临的一个问题是,您需要大量标记的图像才能从头开始训练具有尖端性能的神经网络来完成这项任务。因此,您将需要研究迁移学习,这涉及使用在 ImageNet 上训练的现有图像分类器,并在使用较小的数据集进行训练之前使其适应您的问题。

您拥有的少量样本图像数据将成为您案例的主要限制因素。遗憾的是,在您尝试该项目之前,没有人可以告诉您您是否有足够的深度学习方法。这可能是您最大的失败风险所在。