我有一个新手问题。我试图从谷歌找到答案,但无法得到明确的答案。
MaxEnt 模型是否与多项逻辑回归(即 softmax 回归)完全相同?
看起来两者都试图估计 softmax 函数的参数。只是想知道,那么,它们之间有什么区别?他们是否使用不同的学习方法?
我有一个新手问题。我试图从谷歌找到答案,但无法得到明确的答案。
MaxEnt 模型是否与多项逻辑回归(即 softmax 回归)完全相同?
看起来两者都试图估计 softmax 函数的参数。只是想知道,那么,它们之间有什么区别?他们是否使用不同的学习方法?
MaxEnt是一种设计模型的方法,而SoftMax本身就是一个模型。
MaxEnt 是一种描述观察者对某些系统及其变量的知识状态的方法。例如,如果我有兴趣研究仅取决于一个真实参数的情况 我知道(从实验数据或我的理论模型)这个参数的数据分布的唯一相关特征是它的平均值,我可以这样做:
在哪里是通过实验定义的。然后,使用 MaxEnt 方法,概率分布“更合理”(假设条件更少),是指数分布:
这种方法非常有用,在统计物理学、信息论、统计学、机器学习等方面有很多应用。更多信息可以在Wikipedia和许多 不同的 来源上找到。
更一般地,可以使用具有约束的Discrete MaxEnt为了获得概率分布:
它可以被开发成一个 softmax 函数(我自己没有做过,但我怀疑它一定是类似于本文的内容。
tl;dr MaxEnt 是一种开发概率模型的方法,因此它可以为我们提供非 SoftMax 的其他分类模型。这完全取决于模型的(信息)假设