“图像的衍生物”是什么意思?

人工智能 图像识别
2021-11-13 16:19:09

我正在读一本关于 OpenCV 的书,它谈到了一些图像的衍生,比如sobel. 我对图像衍生感到困惑!来源于什么?我们如何从图像中推导出来?我知道我们将图像(1 通道)视为具有 0 到 255 个强度数的 *m 矩阵。我们如何从这个矩阵中推导出来?

编辑:书中的一段文字:

导数和梯度

最基本和最重要的卷积之一是计算导数(或它们的近似值)。有很多方法可以做到这一点,但只有少数方法非常适合特定情况。

一般来说,用于表示微分的最常用算子是 Sobel 导数算子。Sobel 算子适用于任何阶的导数以及混合偏导数(例如,∂ 2 /∂x∂y)。

2个回答

Derivative of an Image您提到的上下文中的术语有两个含义。

  1. 矩阵、图像或浮点数,通过卷积、将图像通过二维 NN、应用 FFT 分析或其他一些过程从图像导出。在这种情况下,Derivative这个词暗示了计算的方向:图像 B 是从图像 A 导出的。
  2. 一个矩阵或立方体,表示正在处理的图像中的变化率。只测量一个维度上两个相邻像素之间的变化,一次只测量一个方向,但这种技术的应用非常有限,这样的序列是有差异的,根本不是光导数的合理近似。在实际识别系统中更有用的是二维或六边形窗口(高斯、汉明、汉宁、梯形、余弦等),跨空间,对于视频,跨时间。微积分项导数应始终参考使用这些技术逼近的理论表面,而不是逼近表面的离散矩阵或立方体。

这种基于多维卷积和神经网络的方法对捕捉噪声和方向细微差别不太敏感。二维全图像或加窗 FFT 技术取得了很大成功,因为过滤要检测的特征的预期频率范围仅仅是一个衰减过程。二维和三维样条也可以调整为在以独立于方向的方式检测特征时有用。

除了灰度分析之外,还可以选择颜色和透明度通道进行独立或并行分析,或添加到从中获取导数的拟合模型的维度中。

深度网络的进步已经发展成为图像处理和识别研究的新领域,为机器人技术、自动化运输和控制论带来了新的希望。

想象一条穿过图像的线。沿线的所有像素都算作值,因此您可以像函数一样绘制沿线的像素。

导数是那个“功能”的。黑色图片和白色图片具有相同的导数 (0),但从黑色渐变到灰色的图像将具有大于或小于零的常数导数,具体取决于线条相对于渐变的方向。硬对比在线条中穿过白色/黑色边界的点处具有巨大的导数。通常将行和列用作线,但您也可以铺设任何斜线,有些算法会这样做。

在这种情况下,术语“导数”有点用词不当,因为通常像素值确实由一个函数拟合,然后对其进行导数,但“导数”是通过查看从一个像素到一个像素的差异直接获取的它是邻居。

dsp.stackexchange 中有一个线程处理这个问题,下面的说明性图片来自那里: 在此处输入图像描述