用于评估神经网络生成的单词的度量

数据挖掘 rnn
2021-09-26 18:30:43

我手头有这项任务,我将不胜感激。完全不是最终的解决方案,因为我想自己做。

假设我需要根据现有的水果名称创建新的水果名称。

我使用textgenrnn库制作了它。

现在我有一个潜在的新名字列表。我想建立一个可以计算的指标,例如:

  1. (Fabic、Alis、Brooty、Morange 等)是潜在的好水果名称
  2. (Ssae、Sriew、Adeoie、Seeea)是潜在的坏水果名称。

是否有任何用于生成单词的指标列表?

截至目前,我找到了以下资源:

但是因为我今天了解了它们,所以我需要对这个验证主题进行更普通的介绍。

1个回答

也许有人会有更好的主意,但默认方法是生成一组名称,然后让一些注释者将它们标记为好或坏(可能将它们从 1 非常差评分到 5 非常好),最后训练一个监督模型来识别好坏。这种方法还可以让您有机会检查注释者间的一致性,即评估好与坏的选择有多主观。通常,使用无监督度量很难(或不可能)完成主观任务。