光滑度测量

机器算法验证 图像处理 平滑
2022-04-09 06:04:57

我有一张图像,其中包含我正在使用特定过程删除的人工制品。我想表明这个过程改进了新图像。为了比较这两个图像,我使用了图像特定行的数据。

这将是更改前的数据(特定行的强度):

y1=[118 117 118 120 80 117 118 120 118 119 121 119 121 118 121 120 118 80 120 121]

以及处理后的数据:

y2=[118 117 118 120 118 117 118 120 118 119 121 119 121 118 121 120 118 119 120 121]

以上数据并不是全部数据(有上万个数据点,这只是一个例子)。我知道有一些方法可以证明这两个数据集是不同的,但我想展示的是第二个数据集现在更加平滑,因此新图像得到了改进。

有人知道这样的指标吗?

4个回答

传统的平滑度测量基于导数,有时称为“粗糙度”。例如,在平滑样条曲线中有一个粗糙度惩罚,您可以将其最小化以获得平滑曲线。在样条曲线的情况下,您需要连续的一阶导数,因此,粗糙度基于二阶导数平方的积分:

[f(x)]2dx

在您的情况下,您可以使用对应于二阶导数的二阶差分:

D2=i[xi2xi1+xi2]2/4

演示

这是您的数据集的演示。对于您的两个系列,此度量 D2 是: 在此处输入图像描述

水平图:

在此处输入图像描述

这是第二个差异图:

在此处输入图像描述

我们看到第一行要粗糙得多。

为什么不是D1?

让我们看看为什么对于平滑度(粗糙度),二阶导数通常更合适。

考虑这两个系列:

在此处输入图像描述

在此处输入图像描述

一阶差分平方和相同:18 二阶差分平方和分别为:0和72,很好的代表了直观可见的粗糙度。

这是第一个差异的情节:

在此处输入图像描述

这是第二个差异的情节: 在此处输入图像描述

结论

您可以寻求更高的差异,例如第三个差异,但追求第一个差异对测量平滑度没有帮助。原因是我们对平滑度的直观理解与任何一阶导数兼容!任何有趋势的序列都会有一阶导数,不一定是粗略的序列。当一阶导数开始跳跃时,该系列很粗糙,也就是高阶导数很高的时候。

如果这是一个图像,那么在我的理解中,一行应该显示相邻像素之间的渐变。在这种情况下,自相关(移动一个像素后数据与其自身的相关性)应该作为平滑度的度量。

但是,使用您的示例,自相关性只会略有增加。使用 R:

y1 <- c(118, 117, 118, 120, 80, 117, 118, 120, 118, 119, 121, 119, 121, 118, 121, 120, 118, 80, 120, 121)
y2 <- c(118, 117, 118, 120, 118, 117, 118, 120, 118, 119, 121, 119, 121, 118, 121, 120, 118, 119, 120, 121)

acf(y1, plot=FALSE, lag.max=1)

# Autocorrelations of series ‘y1’, by lag

     0      1
 1.000 -0.095

acf(y2, plot=FALSE, lag.max=1)

# Autocorrelations of series ‘y2’, by lag

    0     1
1.000 0.086

如果您选择的行中没有太多事情发生,则可能会发生这种情况。即它只有相同颜色的阴影。或者,如果图片上的绘图边缘非常细,以至于对象的轮廓只有一个像素宽。在这种情况下,将行移动一个像素会使边缘错位。

测量非平滑度的一种方法是首先对数据进行平滑处理,将其减去,然后计算出你有多少残差(即所有残差的平方和)。即您可以应用拉普拉斯滤波器并计算两个图像的残差平方和并进行比较。

我完全同意@Tim 关于方差的评论,但我有动力更进一步,这正是我想要的。我取了 20 个值在此处输入图像描述并思考 AUTOBOX 将如何处理这些值,基本上重新访问了这篇文章如何计算不包括异常值的集合的标准平均值? .

AUTOBOX 使用此处开发的程序进行了以下调整以清理数据http://docplayer.net/12080848-Outliers-level-shifts-and-variance-changes-in-time-series.html此外,在周期 4 识别异常值和从周期 8 开始的持续电平/阶跃变化。

在此处输入图像描述

Actual and Cleansed Data 的情节对于人眼看到的和看不到的具有教育意义。在此处输入图像描述.

我们最初错过的是第 4 期的微妙但重要的异常和第 8 期的持续电平偏移,因为我们专注于第 5 期和第 18 期的压倒性脉冲影响。

更进一步(小样本总是危险的,但当有强信号时不一定如此)模型的残差表明从周期 7 到 20 的恒定/持续模糊(增加的误差方差)在此处输入图像描述

我真正回答的问题是“有更好的过程吗?” 在使数据更平滑方面?即受模糊影响较小。或者是否有可能进一步减少方差(非系统行为)?