你把不包括异常值的平均值称为什么?

机器算法验证 术语 异常值 平均类型
2022-01-20 22:26:54

你把不包括异常值的平均值称为什么?

例如,如果您有一组:

{90,89,92,91,5} avg = 73.4

但不包括我们有的异常值 (5)

{90,89,92,91(,5)} avg = 90.5

您如何在统计数据中描述这个平均值?

4个回答

这称为修剪后的平均值基本上你所做的是计算中间 80% 数据的平均值,忽略顶部和底部 10%。当然,这些数字可能会有所不同,但这是一般的想法。

一种统计上合理的方法是使用标准偏差截止值。

例如,删除任何结果 +/-3 标准偏差。

使用“最大 10%”之类的规则是没有意义的。如果没有异常值怎么办?无论如何,10% 规则会消除一些数据。不可接受。

识别异常值的另一个标准测试是使用 LQ(1.5×IQR) 和 UQ+(1.5×IQR)。这比计算标准差要容易一些,而且更通用,因为它不会对来自正态分布的基础数据做出任何假设。

您所说的“平均值”实际上称为“平均值”。

它并不能完全回答您的问题,但不受异常值影响的不同统计数据是中位数,即中间数。

{90,89,92,91,5} mean: 73.4
{90,89,92,91,5} median: 90

这可能对你有用,我不知道。