使用神经网络从图像中提取多个参数

数据挖掘 神经网络 深度学习 计算机视觉
2021-09-21 11:30:10

我想使用神经网络从图像中提取参数。

例子:

给定一张砖墙的图像,NN 应该提取砖的宽度和高度、颜色和粗糙度。

我可以为给定的参数生成图像来训练 NN,并希望使用它从实际图像中提取参数。

我研究过CNN。我可以和他们一起执行这项任务吗?我是否需要特殊的学习算法来提取多个参数而不是分类?是否有针对此类任务设计的 NN?

1个回答

如果您期望原始图像比例、旋转照明等发生变化,并且还有大量训练数据,那么 CNN 可能是此任务的不错选择。

通常的 CNN 架构是靠近输入的卷积层和输出的全连接层。这些全连接层可以根据您认为合适的方式为不同的分类或回归任务安排输出。预测描述图像的参数值是一项回归任务。

如果您想要准确测量大小,您可能需要避免使用最大池化层。不幸的是,不使用池化会使你的网络变得更大,更难训练——如果这对你来说是个问题,你可能会选择跨步卷积。

如果您的输入图像非常简单清晰(因为它们总是由计算机生成),那么其他方法可能更可靠。您可能能够对图像生成进行逆向工程并得出简单的规则,例如识别线、角、圆和其他易于过滤的图像组件,并进行直接测量。也可能存在复杂性的中间地带,将这些数据作为特征提取并使用它来训练简单的 NN(或其他 ML 模型)将具有良好的性能。