高于某个百分位的所有值叫什么?我如何在熊猫中获得它?

数据挖掘 熊猫 术语
2022-03-07 08:04:09

假设我有一个数字列表,我想要所有大于 95% 的数字的平均值。该值是否有一些标准术语?(“直方图箱的平均值”?“条件平均值”?)

是否有 pandas 标准库函数来计算它?

1个回答

我认为没有标准库。

您可以跳过 nan 值作为均值将它们视为零,这可能会弄乱结果。

import pandas as pd
df=pd.DataFrame(lst) #For a given list
df[df >= df.quantile(.95)].mean(skipna=True)