在简单的英语中,Otsu 阈值的类内和类差异是什么?

信息处理 图像处理 计算机视觉 阈值
2022-02-02 03:57:14

在过去的一周里,我浏览了许多关于Otsu 阈值的研究论文和教程。甚至写信给作者,但每一个解释都是在“类”和“差异”方面。我不太擅长统计,所以我很难想象这些类和方差在实际图像中的含义。我有几个问题(以粗体标记)会引出主要问题。

到目前为止我所理解的:
1. 我们需要将图像分成两部分。暗像素和亮像素。这就是所谓的两个类。对于这个解释,我们可以称它们为“黑暗”和“光明”而不是“阶级”。
2. 创建一个 0 到 255 个位置的直方图阵列,其中每个位置包含强度为 0、1、2、...255 的像素总数。假设强度为 0 到 9,像素数为 20、5、23、6、3、23、5、8、67。
3. 任何这些强度(假设强度 1)的概率计算为 = 1 / (180 * 200),其中 180 是图像的长度,200 是图像的宽度。
4. 暗像素和亮像素的概率之和是暗像素和亮像素的权重。
5.问题:当我们计算像素的平均值时,它究竟意味着什么?这就像取概率的平均值一样吗?如果它像一个平均值,那么如果阈值在直方图的第 100 位,为什么我们不能简单地将其计算为:(从 0 到 99 的强度之和)/(99)?通过对均值进行复杂的计算,我们有什么额外的好处?
6. 然后我们从平均值得到像素分布的方差,我理解,但是问题:当我们取亮像素的方差之和和暗像素的方差之和时,它意味着什么?它是否说明暗像素与亮像素中存在的强度变化量?
7.问题:什么是简单英语中的“类内方差”和“类间方差”?我可以看到公式,但它没有意义。类内方差是否只是一种说法“暗像素相对于中间最暗像素的变化量加上亮像素相对于中间最亮像素的变化量”?
8.问题:什么是简单英语中的“类间方差”?公式本身很奇怪,因为没有方差,而只是权重和均值的总和。但是,就像素而言,这在简单的英语中是什么意思?

ps:请不要使用统计/数学术语,请尝试用简单的英语解释它,就像我在上面的引号中加上一些解释一样。我(和这个世界上的许多人)很难理解统计术语,因为它的教学方式从未让我们完全理解它。

1个回答

我避免使用明暗标签,因为您可以说我们选择 128 作为阈值,可以完美区分明暗像素,但考虑到您的图片只有两个灰度级,即 240 和 250,并且您想要标记它们,但两者似乎要轻。

现在考虑一个例子,你有一部分由软组织和骨骼组成的 X 射线图像,你想将它们分开。我们知道骨骼在 X 射线图像中通常比软组织具有更高的强度。但是骨骼的某些部分很薄,而软组织的某些部分很厚,因此某些属于骨骼的像素的强度低于属于软组织的像素。在这个问题中,我们选择的任何阈值都会导致一些未标记的像素。

让我们考虑更多细节。骨骼有厚和薄的区域,导致骨骼平均强度的变化,这种变化称为类内方差,平均值表示骨骼强度值。软组织也是如此。软组织平均值与骨骼平均值之间的差异称为类间方差。

在理想情况下,我们有最小的类内方差,并且平均值必须尽可能远离彼此(类间方差最高),以使这两组之间的混合最小。