训练用于对图像中的像素进行分类的基本马尔可夫随机场

机器算法验证 期望最大化 图像处理 分类
2022-01-31 00:11:10

我正在尝试学习如何使用马尔可夫随机场来分割图像中的区域。我不明白 MRF 中的一些参数,或者为什么我执行的期望最大化有时无法收敛到解决方案。

从贝叶斯定理开始,我有,其中是像素的灰度值,是类标签。我选择对使用高斯分布,而使用 MRF 建模。p(x|y)=p(y|x)p(x)/p(y)yxp(y|x)p(x)

我对 MRF 使用了一个势函数,该函数具有成对的团势和被分类像素的类标签的势值。单个像素的潜在值是一些取决于类标签对 4 个连接的邻居评估成对势函数,如果邻居具有与该像素相同的类标签,则αxββ

在期望最大化点,我必须找到最大化对数似然的期望值的值,我使用了数值优化方法(尝试共轭梯度,BFGS,鲍威尔方法)但是总是会发现的值会变为负值, s 会急剧增加,并且一两次迭代后,整个图像将仅分配给一个标签(背景:使用 ICM 完成给定 MRF 参数的类标签分配) . 如果我删除了 alpha,即只使用成对的集团势,那么期望最大化就可以了。α(x)ββα

请解释每个班级的阿尔法的目的是什么?我认为它们与图像中存在的该类的数量有关,但似乎没有。一旦我让 MRF 只使用成对电位,我将它与直接的高斯混合模型进行比较,发现它们产生了几乎相同的结果。我原以为成对的潜力可以使课程变得平滑一点,但这并没有发生。请告知我哪里出错了。

1个回答

诊断

这听起来像是一个初始化问题。

您使用的 MRF 模型是非凸的,因此具有多个局部最小值。据我所知,所有现有的优化技术都对初始化很敏感,这意味着最终解决方案的质量很大程度上受您从哪里开始优化过程的影响。

建议的解决方案

我建议尝试不同的策略来初始化模型。例如,我想到的一种策略如下:

  1. 训练一个模型,暂时忽略前一项;固定是一致的,例如,通过设置保持它们固定如果你想变得更漂亮,你可以将p固定为表示训练集中标签的相对频率的多项式分布。您可以通过适当地设置值来做到这一点。p(y|x) p(x)α=β=0 p(x)α

  2. 解冻MRF 模型中的一元和成对项;也就是说,让你的优化器改变的值。αβ

建议的初始化绝不是初始化优化的最佳方式,而只是一种可能的选择。

最后,正如Roman Shapovalov所建议的,您可以考虑规范您的先验参数;例如,通过对它们进行高斯先验:其中是超参数这可以解释为高斯先验的方差。λα||α||2+λβ||β||2λαλβ