非标准化对数概率 - RNN

数据挖掘 深度学习 lstm rnn
2021-10-11 23:32:34

我正在阅读 Goodfellow 的深度学习书。在 RNN 部分,我遇到了以下问题:

RNN 定义如下:

在此处输入图像描述

方程是:

在此处输入图像描述

在此处输入图像描述

现在 O(t)以上被认为是非归一化的对数概率。但如果这是真的,那么O(t) 必须是负数,因为,

概率总是定义为 0 到 1 之间的数字,即 P[0,1],其中括号表示闭区间。log(P)0在这个区间。但是在上面的等式中,没有这个条件()0 被明确强制执行。

我错过了什么!

2个回答

从某种意义上说,您是对的,最好将其称为未归一化概率的对数这样,数量可以是正数或负数。例如,日志(0.5)<0日志(12)>0都是非标准化概率的有效对数。在这里,更详细地说:

  1. 可能性: (一世)=e一世/ķ=1ķeķ (使用图 10.3 标题中提到的 softmax,并假设 =(1,..,ķ) 是softmax之前层的输出),

  2. 非归一化概率: ~(一世)=e一世, 可以大于 1,

  3. 非归一化概率的对数: 日志~(一世)=一世,可以是正数或负数。

你是对的,没有停止 ķ()从非负数来看,这里的关键字是“非规范化”。

如果我们让ok(t)=lnqk(t)

y^k(t)=exp(ok(t))k=1Kexp(ok(t))=qk(t)k=1Kqk(t)

Here qk(t) can be any positive number, they will be normalized to be sum to 1.