具有空值的向量的降维

数据挖掘 降维 缺失数据 向量空间模型
2022-03-12 00:11:11

我有相同长度的向量,其中每个条目的值可以是 0、1 或 null。

V = {[0,1,1,1,null,0], [null,1,0,null,0,1], ...}

如何将这些向量降维到较低维空间(在本例中为 2d)?

2个回答

你有几个选择:

这是一个数据争论的问题,您需要在其中进行试验,如果您知道自己的数据,那就更好了。

  • 如果您怀疑 null 表示 0 但用户只是省略了它,则将其替换为零。
  • 如果您可以使用负数,请用 Nicolas 提到的 -1 替换空值,除非 -1 是您的数字自然达到的值。
  • 如果这些空值对您的数据集有重要意义,您可以创建另一列 B,其中 A 列为空。
  • 我能想到的另一件事是,如果您有分类值,那么您可以对这些列进行一次热编码。