词作为神经网络的特征

数据挖掘 机器学习 神经网络 深度学习 lstm nlp
2022-02-25 08:21:17

我是机器学习的新手,我正在处理与文本相关的问题。我知道在 ML 中我们可以将特征作为数值用作神经网络的输入,但我不知道如何将特征用作单词。在一些论文中,我读到我们将特征视为具有某些属性的 n 个单词。我真的不明白这怎么可能。如果这不是问题,请告诉我一些好的论文或教科书或链接,其中解释了如何做到这一点。

1个回答

你需要制作一个单词词典。这意味着您必须制作一个字典,为每个单词分配一个唯一值。那么您可以使用 one-hot-encoding 来唯一地表示每个单词。如果这是你需要的,它会做你想做的。但这有一个大问题。当您想到猫和狗时,您可能会发现它们之间的相似之处和不同之处。这是因为你拥有的知识比你大脑中唯一的单词表示要多。因此,您应该使用方法为每个单词分配一个唯一编号,并将邻近的概念作为邻居。第一部分看这里,第二部分看这里