我熟悉由以下人员编写的 softmax 回归:
为了改变阶级存在,给定观察作为存在. 并使用下标表示选择矩阵的第 i 列和向量的第 i 个元素。这是此答案中使用的公式
但我查看其他来源,例如wikipedia、 ufldl.stanford.edu
它使用以下公式:
在我看来,那个偏见术语显然需要处理类不平衡的情况。
当我们拆分条款时:
它似乎也与贝叶斯定理中的先验概率项相对应:
对我来说似乎是必需的,但也许我错过了一些东西。为什么它在这么多来源中被遗漏?
我熟悉由以下人员编写的 softmax 回归:
但我查看其他来源,例如wikipedia、 ufldl.stanford.edu
它使用以下公式:
在我看来,那个偏见术语显然需要处理类不平衡的情况。
当我们拆分条款时:
对我来说似乎是必需的,但也许我错过了一些东西。为什么它在这么多来源中被遗漏?