我有一个包含分数和类别的数据集,我想计算每个类别的汇总统计数据。数据看起来像这样:
Category Score
AAAA 1
AAAA 3
AAAA 1
BBBB 1
BBBB 100
BBBB 159
CCCC -10
CCCC 9
我想要的是这样的
Category Count Mean Std Min 25% 50% 75% Max
AAAA
AAAA
AAAA
BBBB
BBBB
BBBB
CCCC
CCCC
我一直在考虑将熊猫与两者结合使用.groupby()
,.describe()
就像这样
df.groupby('Category')['Score'].describe()
这几乎看起来像我想要的,但是当我将其视为数据集时,所有统计信息都在索引中。我希望数据采用表格的形式,这样我就可以输出它并从它的背面创建一个可视化。
有任何想法吗?
谢谢