这个问题让我困惑了很久。我理解使用“日志”来最大化可能性,所以我不是在询问“日志”。
我的问题是,既然最大化对数似然等于最小化“负对数似然”(NLL),我们为什么要发明这个 NLL?为什么我们不一直使用“积极可能性”?NLL在什么情况下受到青睐?
我在这里找到了一点解释。https://quantivity.wordpress.com/2011/05/23/why-minimize-negative-log-likelihood/,它似乎深入解释了明显的等价性,但并没有解决我的困惑。
任何解释将不胜感激。