我想创建一个 NLP 自动编码器,它恰好只生成符合诗意韵律的文本,例如“五步抑扬格”。也就是说,输出应该是一系列 10 个音节长的子句,并以“duh-DUH duh-DUH duh-DUH duh-DUH duh-DUH”的口头重读大声朗读。莎士比亚和他的同时代人在他们的大部分诗歌中都使用了这种格式。
我能想到的唯一方法是收集这种格式的文本行,然后在这些文本上训练一个自动编码器。由于网络只在训练时发出抑扬格五音步,它也应该在预测时发出抑扬格五音步。鉴于足够大的语料库,这似乎应该有效。
一个问题是这个训练只接受五步抑扬格。要将其他文本重写为 IP,训练需要包括 IP 中文本的变体并训练(不是 IP 句子)以发出(IP 句子)。生成这些变化很简单。这跨越了从训练“句子嵌入”到训练“思想嵌入”的界限。
还有其他方法可以解决这个问题吗?有没有办法直接改变句子嵌入空间?例如,变分采样通过在嵌入空间上应用非线性变换来工作。
注意:CMU 发音词典提供超过 100k 单词的发音重读,可用于对仪表进行分类: http ://www.speech.cs.cmu.edu/cgi-bin/cmudict
注意:这是一个自学深度学习和 NLP 的个人爱好项目——我真的不知道用当前的 NLP 技术是否可以实现。