在 Tensorflow 中,有 9 个不同的特征列,分为三组:分类、密集和混合。
通过阅读指南,我了解到分类列用于表示具有数值的离散输入数据。它给出了一个名为categorical identity column的分类列的示例:
ID Represented using one-hot encoding
0 [1, 0, 0, 0]
1 [0, 1, 0, 0]
2 [0, 0, 1, 0]
3 [0, 0, 0, 1]
但是您也有一个称为指示列的密集列,它“包装”(?)一个分类列以产生看起来几乎相同的东西:
Category (from category column) Represented as...
0 [1, 0, 0, 0]
1 [0, 1, 0, 0]
2 [0, 0, 1, 0]
3 [0, 0, 0, 1]
因此,“分类”和“密集”列似乎都能够表示离散数据,因此这不是区分它们的原因。
我的问题是:原则上,“分类列”和“密集列”有什么区别?
我已经阅读了解释指标列和分类标识列之间区别的答案,但我正在寻找一个更通用的答案来区分分类列和密集列。