使用 Python 按类别汇总统计信息

数据挖掘 Python 熊猫
2021-10-10 17:07:13

我有一个包含分数和类别的数据集,我想计算每个类别的汇总统计数据。数据看起来像这样:

Category    Score    
AAAA        1
AAAA        3
AAAA        1
BBBB        1
BBBB        100
BBBB        159
CCCC        -10
CCCC        9

我想要的是这样的

Category    Count   Mean   Std   Min   25%   50%   75%   Max     
AAAA        
AAAA        
AAAA        
BBBB        
BBBB        
BBBB        
CCCC        
CCCC        

我一直在考虑将熊猫与两者结合使用.groupby().describe()就像这样

df.groupby('Category')['Score'].describe()

这几乎看起来像我想要的,但是当我将其视为数据集时,所有统计信息都在索引中。我希望数据采用表格的形式,这样我就可以输出它并从它的背面创建一个可视化。

有任何想法吗?

谢谢

1个回答

国际大学联盟:

In [80]: df.groupby("Category")['Score'].describe().reset_index()
Out[80]:
  Category  count       mean        std   min    25%    50%     75%    max
0     AAAA    3.0   1.666667   1.154701   1.0   1.00    1.0    2.00    3.0
1     BBBB    3.0  86.666667  79.839422   1.0  50.50  100.0  129.50  159.0
2     CCCC    2.0  -0.500000  13.435029 -10.0  -5.25   -0.5    4.25    9.0