使用字符串输入训练神经网络分类器

数据挖掘 分类 深度学习 数据清理
2022-03-08 07:40:26

我的论文题目是关于建立一个(深度)神经网络分类器来对一个地方的类型进行分类。我得到了字符串类型的标签和一些输入。例如,标签“超市”可能具有“食品”之类的特征。

我应该如何将我的字符串输入特征提供给神经网络?

换句话说,有没有什么有效的方法可以用数字值替换那些字符串输入,知道它们有很多吗?

2个回答

您总是避免将直接字符串输入神经网络。这个线程在这里解释了为什么你应该避免这样做:神经网络解析字符串数据?

一旦您将您拥有的字符串转换为向量或任何其他形式的数字表示并将您的标签编码为分类,它将解决您手头的问题。

如果您需要我对此进行详细说明,我将非常乐意这样做。

我想到的第一件事是单热编码,但如果你说你有这么多不同的字符串,并且如果你想在编码步骤中捕获语义,你应该考虑词嵌入。