我已经看到了困惑度指标的 2 个定义:
PP=2H(p)PP=2H(p)
和
PP=2H(p,q)PP=2H(p,q)
如果我理解正确,第一个仅告诉我们模型对其预测的信心程度,而第二个反映了模型预测的准确性/正确性。我对么?
当人们声称他们的语言模型在论文中达到 X 困惑度时,他们实际上指的是哪一个?