我有大约 20-30 列,所有列都有不同的长度。第一列有 25000 行,第二列有 19000 行,并且所有列都不同。
都是调查数据,有 0(否)、1(是)和 666(对于缺失数据)值。我想对这些数据执行 PCA。由于每列的长度不等,由于大多数长度较短的列的“NaN”值,我很难进行 PCA。
我不希望大部分信息丢失,所以我不愿意删除较长列的行并使每一列的长度相等。
请告诉我可能的解决方案。
我有大约 20-30 列,所有列都有不同的长度。第一列有 25000 行,第二列有 19000 行,并且所有列都不同。
都是调查数据,有 0(否)、1(是)和 666(对于缺失数据)值。我想对这些数据执行 PCA。由于每列的长度不等,由于大多数长度较短的列的“NaN”值,我很难进行 PCA。
我不希望大部分信息丢失,所以我不愿意删除较长列的行并使每一列的长度相等。
请告诉我可能的解决方案。