我正在尝试通过同时可视化多个特征散点图来可视化数据以进行探索性数据分析,类似于这个问题。但是当使用大量特征(~50)和行(~50K)时,我很快遇到了问题。虽然我喜欢使用seaborn pairplots,但生成大量的绘图窗格对于大量的特征和观察来说可能会变得难以计算。将一个非常大的表子化为较少数量的特征或观察似乎并不完整。
我的问题是:在 python 中为 EDA 绘制许多功能的有效方法是什么?如果没有一种有效的方法,那么是否有一种有效的方法来减少特征或观察的数量
我正在尝试通过同时可视化多个特征散点图来可视化数据以进行探索性数据分析,类似于这个问题。但是当使用大量特征(~50)和行(~50K)时,我很快遇到了问题。虽然我喜欢使用seaborn pairplots,但生成大量的绘图窗格对于大量的特征和观察来说可能会变得难以计算。将一个非常大的表子化为较少数量的特征或观察似乎并不完整。
我的问题是:在 python 中为 EDA 绘制许多功能的有效方法是什么?如果没有一种有效的方法,那么是否有一种有效的方法来减少特征或观察的数量
我会建议 t-SNE(只是谷歌它)。它可以帮助您对高维数据的内容有一个总体的了解。请注意,t-SNE 的参数非常敏感,因此您需要付出一些努力才能找到一个好的嵌入。