我正在做一个使用 CNN 和 tensorflow 对肺 CT 数据集进行分类的项目,我知道该类别的顺序是癌症/非癌症(只有 2 个类),在多个 Github 存储库中我看到他们做了一个热编码像下面的代码:
if label == 1:
label = np.array([0, 1])
elif label == 0:
label = np.array([1, 0])
让我感到困惑的是:1 表示癌症,0 表示没有癌症,据我所知应该是:
if label == 1:
label = np.array([1, 0])
elif label == 0:
label = np.array([0, 1])
但是为什么他们这样做了一个这样的热编码,我不知道我错了,或者还有另一件事我不明白,谁能解释一下?或者给我一个更好的方法来对我的数据进行编码,但是用代码?