为什么在逻辑回归似然中有些公式的系数在前面,而有些则没有?

机器算法验证 物流 最大似然 可能性
2022-03-29 14:25:30

我正在推导逻辑回归的可能性。我看过两个不同的版本:

(1)f(y|β)=i=1Nniyi!(niyi)!πiyi(1πi)niyi

或这个

(2)L(β0,β1)=i=1Np(xi)yi(1p(xi))1yi

为什么会有niyi!(niyi)!在等式 1 中?

资料来源:

  1. 首先:https ://czep.net/stat/mlelr.pdf (第 3 页 equ. 2)
  2. 第二: http: //www.stat.cmu.edu/~cshalizi/uADA/12/lectures/ch12.pdf(第5页equ.12.6)

注意:这个问题不是“可能性仅定义为比例乘法常数”在实践中是什么意思的重复?在看到它是如何完成的之后,可以将答案追溯到二项分布。但是没有人会知道那个帖子中的问题是这个问题的答案。

1个回答

第二个是第一个的特例。您的第一个参考文献讨论了每个yi分布为具有样本大小的二项分布ni,而第二个参考假设每个yi是伯努利随机变量。这就是区别:当每个ni=1,niyi!(niyi)!=1.

一些支持这一点的引用:从第一个参考中的 2.1.2 开始:

由于任何一个成功的概率ni试验是 πi...

从第二个参考 12.1 的第一部分开始:

让我们选择其中一个类并称之为“1“ 和另一个 ”0“……