我是机器学习和 keras 的新手,现在使用 keras 处理多类图像分类问题。输入是标记图像。经过一些预处理后,训练数据在 Python 列表中表示为:
[["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"],
["bird", "path/to/cat/imageX.jpg"]]
“狗”、“猫”和“鸟”是类标签。我认为应该使用 one-hot 编码来解决这个问题,但我不太清楚如何处理这些字符串标签。我LabelEncoder()
以这种方式尝试过sklearn:
encoder = LabelEncoder()
trafomed_label = encoder.fit_transform(["dog", "cat", "bird"])
print(trafomed_label)
并且输出是 [2 1 0],这与我对 [[1,0,0],[0,1,0],[0,0,1]] 之类的期望输出不同。它可以通过一些编码来完成,但我想知道是否有一些“标准”或“传统”的方式来处理它?