均值能否超出四分位范围(Q1 和 Q3)?如果是这样,它对分布有什么影响

机器算法验证 意思是 四分位数
2022-03-25 17:43:57

均值能否超出四分位范围?我意识到极端异常值会影响或拉动均值,但它可以将均值拉到从第一个四分位数到第三个四分位数的区间之外吗?

1个回答

如果“均值”指的是一批数据的统计量,那么考虑数据集,其四分位数必须介于之间(取决于您如何计算它们)但其均值是(1,2,3,4,106)14200,002

如果相反,它指的是分布的属性,则为前一批中的五个数字中的每一个分配的概率以创建(离散)分布。应用相同的计算,得出相同的结论。1/5


关键是四分位数对数据的变化有抵抗力,而平均值对任何一个数据值的变化都很敏感。当我们将数字的数据集中的任何单个值时,均值会改变原始数据集中的相邻值,因此它们可以更改的程度受到限制。前面的示例以极端的方式利用了这一点。ϵn>4ϵ/n

影响函数研究数据值的这种变化如何在这些值的统计摘要中产生变化。