数据挖掘 - FastText 模型解释 - 吾爱随笔录

我正在阅读 FastText论文，我对用于分类的模型有一些疑问。由于我不是 NLP 背景，有些我不熟悉行话。在图中，具体是什么 $x_i$ ? 我不确定是什么 $N$ ngram 特征的意思。如果我的文件有总 $L$ 的话，那么我怎么能用 $N$ 变量（ $x_1$ ,.., $x_n$ )? 究竟是什么 $N$ ?

- \frac{1}{ñ} \sum_{n = 1}^{ñ} {是的}_{n} 日志 (F (乙 一种 X_{n}))

$-\frac{1}{N}\sum_{n=1}^Ny_n\log(f(BAx_n))$ 如果

y_{n}

$y_n$ 是标签，那么在softmax之后将它与输出向量相乘有什么意义（标签就像0,1,2,3,..）？作者的意思是我们采取

y_{n}

$y_n$ - 损失计算中输出向量的第一个分量？