哪个图表适合可视化任务?

数据挖掘 可视化 数据 熊猫 绘图
2022-03-10 17:34:09

我有一些针对美国和中国的终端收费值,它们来自一个 pandas DataFrame,如下所示,

       value country  
0      550.0     USA        
1      820.0   CHINA        
2      835.0   CHINA        
3      600.0   USA        
4      775.0   CHINA        
5      785.0   USA        
6      790.0   USA   

这是示例数据,我总共有 5K+ 条目。数据已清除异常值,需要可视化。我可以使用什么样的可视化来有意义地绘制我的数据?

3个回答

也许你可以尝试这样的事情?

df.hist(by='country', bins=50)

如果您想在同一图中绘制这些直方图,请查看

参考

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.hist.html

如果您需要能够识别充电时间的好坏,那么这些点本身就很重要。

我会让我的 x 轴是我的国家名称,然后简单地将 y 轴上的充电时间绘制为散点。

这将为您提供每个国家/地区数字化的 y 方向上的分散数据。

我认为您将能够从该图中提取很多有意义的信息来比较不同的国家,例如:最大、最小、大约。意思等。

这取决于你的目标是什么。

由于您有这么多的值,您可能想要绘制一些汇总数据,因此您可以使用 FacetGrid 中的两个Distplots将两个国家并排放置,甚至更好的是Boxplot

如果值的出现顺序很重要,您可以尝试使用 FactorPlot 将它们绘制为两条不同的线,并在 y 轴上显示值。

(上面提到的所有图都是 Seaborn 库的一部分)