CNN 概率方程的含义

数据挖掘 美国有线电视新闻网 图像分类 符号
2022-03-11 11:36:22

在此处输入图像描述

所以上面的第一个等式是指用于图像分类的 CNN(而不是 CNN 委员会)。我无法准确理解作者在第一个等式中试图做什么。

到目前为止,我认为他们正在计算所有委员会的最大似然概率指数,然后将所有委员会的这些指数的概率相加,最后得出最大指数。

但这似乎过于复杂,我不太确定。有人可以澄清一下吗?

1个回答

我同意这个等式可能不清楚,但您可以将其分解为以下内容:

  • 首先,术语 告诉您在给定输入对象中哪个标签的概率更高。argmaxkpi(y=k|x)ix
  • 然后,这会“迭代”委员会中的所有模型,为每个模型计算最有可能的标签。
  • 最后找到最常见的标签(即)。argmaxj

此外,在伪代码中考虑它也很有帮助

def get_label(CNNs, x):
    labels = [0, 0, 0, 0, 0]  # each position refers to that last $j$
    for pCNNi in CNNs:
        predictions = pCNNi(x)
        label_i = predictions.index(max(predictions))  # this is the argmax_k
        labels[label_i] += 1
    return labels.index(max(labels))  # this is the argmax_j