什么 NN 架构可以根据描述来预测幻想角色的名字?

数据挖掘 生成模型 嵌入 文本生成
2022-01-25 22:06:49

我想建立一个神经网络来预测给定描述的幻想角色名称。

像“疤痕脸长发精灵战士”->“格洛芬德尔”

我有一个数据集,包含来自各种奇幻作品的大约 12,000 个奇幻名称和描述。我希望能够将描述映射到名称。名称不是词汇,我希望 NN 能够为新描述生成新名称。

我想使用像 Elmo 这样的东西来嵌入描述和名称,然后可以轻松地教 NN 将一个映射到另一个,但我面临的问题是如何从嵌入向量返回到表示单词的字符。

2个回答

首先,我认为由于您的模型的目标是根据描述生成新名称,因此您的模型应该在字符级别而不是单词级别上工作。

您可以将模型的工作级别视为您为其提供的构建块(它需要在训练期间学习它们)。这些构建块然后用于生成新构造。因此,如果您想构建新单词(名称),则需要教模型理解各个字符与输入描述之间的联系。您的模型可以处理单词级别的输入,但其输出需要在字符级别。

您可以在以下位置阅读更多相关信息:除了 Word Embedding,为什么还需要了解 Character Embedding?

使用char-rnn我用它制作了一个 Twitter 机器人@peopledex,它根据名称生成 Pokemon 描述,但你可以轻松地反转字段。

示例 - 冒号前的位是名称(输入),后是描述(输出)。

  • Dribbur:考虑到进化,它寻求喷雾的到来。该区域从后面开始。
  • Convictur:当它进化成一百种特殊的磁力时它就静止了。结果,岩浆穿过它的身体发出光芒。
  • 诉讼人:它在有毒的树木上光滑并从化石中复活。它可以压缩从光中复活的细丝

描述没有多大意义,但名称问题不大。好消息是与虚构的一代一起工作没有错误的答案。