正如 Google Wavenet 的第一篇文章 ( https://arxiv.org/pdf/1609.03499.pdf ) 中所述,该模型可以使用链式法则来近似整个序列(原始音频波形)的联合概率。他们使用一些扩张因果卷积来实现这一点。然而在 2017 年,他们发表了一篇关于音符神经音频合成的新文章 ( https://arxiv.org/pdf/1704.01279.pdf )。在这篇文章中,序列的联合概率公式(使用链式法则)与上一篇文章不同。我相信第一篇文章中的链式规则是正确的,但我无法理解第二篇文章中的相同规则。为了完整起见,我报告了文章中的公式:
我认为应该给它 x1...x(i-1)。
这是正确的吗?
