数据挖掘 - Word2Vec、softmax 函数 - 吾爱随笔录

我通过 word2vec (SKIP-GRAM) 模型的 softmax 函数逐项进行。我发现这些函数的大多数定义都不是“清楚”的，所以我修改了符号以确保我理解它。

以下公式是否正确？

P (w_{- t} | w_{t}; θ) = s o f t m a x (s c o r e (w_{- t}, w_{t}))

$P(w_{-t} | w_{t} ; \theta) = softmax(score(w_{-t}, w_t))$

P (w_{- t} | w_{t}; θ) = \frac{e x p (s c o r e (w_{- t}, w_{t}))}{\sum_{w^{'} \in θ} e x p (s c o r e (w^{'}, w_{t}))}

$P(w_{-t} | w_{t} ; \theta) = \frac{exp(score(w_{-t}, w_t))}{\sum_{w' \in \theta} exp(score(w', w_{t}))}$

在哪里：

$w_{-t} =$ 上下文

$w_{t} =$ 目标词

$score(A,B)$ 向量 A 和 B 之间的相似性度量。

$\theta =$ 词汇表中所有单词的向量表示

在最简单的情况下：

s c o r e (A, B) = A \cdot B

$score(A ,B) = A \cdot B$