什么是可视化高维(比如 n=10)二进制数据的好方法?我记得几年前读过一些关于它的东西。
例如,您想根据配料(例如火腿、鸡肉、蘑菇等)绘制/聚类比萨饼。
什么是可视化高维(比如 n=10)二进制数据的好方法?我记得几年前读过一些关于它的东西。
例如,您想根据配料(例如火腿、鸡肉、蘑菇等)绘制/聚类比萨饼。
即使这是二元的,您也可以进行缩放的主成分分析 (PCA)。通过将结果投影到第一个主成分的 2D 平面上,您可以了解数据的聚类。
在 R 中:
# data is your data.frame/matrix of data
pca <- prcomp(data, scale.=TRUE)
# Screeplot to see how much variance is in the 2D plane
plot(pca)
# Projections
plot(data %*% pca$rotation[,1:2])
有时,对于二进制数据,平行坐标图可以很好地工作(您仍然必须使用它,但它会比使用非二进制数据好得多)。