在条件 GAN 中,我们将随机噪声和标签作为输入提供给生成器。在这篇论文中,我不明白为什么在论文的一个部分中,他们说他们将随机噪声作为输入,而在论文的另一部分中,他们说将其连接到输出。
第2页
第 2 页脚注
第 3 页模型设置部分
论文概述:代码切换是口语中的一种现象,我们在两种不同的语言之间切换。混合语言模型在更高程度上提高了自动语音识别的准确性,但问题是混合语言书面句子的可用性较低。因此,作为一种数据增强技术,开发了条件 GAN 以从纯普通话句子中合成英语、普通话混合句子。经过训练的生成器充当代理,告诉必须翻译普通话句子中的哪些单词。它输出一个二进制数组(长度等于输入的普通话句子长度)。生成器和判别器都是 BLSTM 网络。
#####EDIT:作者承认这是一个错字,噪声应该在嵌入层之后连接而不是BLSTM的输出作者回复:这是第3页的错字。噪声与输出连接嵌入层。感谢您的指正。#####



