这个问题是关于语义分割的。
我们对每个像素进行加权,
αc = median freq/freq(c)
其中 freq(c) 是 c 类的像素数除以存在 c 的图像中的像素总数,并且中值 freq 是这些频率的中值
但是,我很难理解作者的意思:
“c 类的像素数”。它们是指一张图像或所有图像中 C 类的像素数吗?
“存在 c 的图像中的像素总数” - 它们是否意味着每个图像的像素总数除以同一图像中 c 类的像素数?
“中位数频率是这些频率的中位数”
看完上面,我对这个概念的印象就是这个实现的形式:
对于每个图像,计算像素数 C 并将其除以图像中的总像素数。这会给你一个频率 f_i
对于每个图像,计算 f_i,然后按升序对其进行排序,然后得到中值频率。这会给你 median_freq
要计算 freq(c),请计算所有图像中 c 像素的总数,然后将其除以所有图像中的像素总数。
最后,根据公式计算每个像素的权重。
意思是说实现计算c的中值频率,也就是c类在每个图像中的存在,然后将其除以所有图像中c类的平均存在。
但是,我不认为这种实现会导致主导标签的权重减少,因为如果主导标签经常以相同的数量出现并且平均值与中位数相差不大,那么权重将大致等于 1。所以这对班级平衡有何帮助?有人可以澄清我的实现是否正确或澄清这个概念吗?
谢谢你。