你把不包括异常值的平均值称为什么?
例如,如果您有一组:
{90,89,92,91,5} avg = 73.4
但不包括我们有的异常值 (5)
{90,89,92,91(,5)} avg = 90.5
您如何在统计数据中描述这个平均值?
你把不包括异常值的平均值称为什么?
例如,如果您有一组:
{90,89,92,91,5} avg = 73.4
但不包括我们有的异常值 (5)
{90,89,92,91(,5)} avg = 90.5
您如何在统计数据中描述这个平均值?
这称为修剪后的平均值。基本上你所做的是计算中间 80% 数据的平均值,忽略顶部和底部 10%。当然,这些数字可能会有所不同,但这是一般的想法。
一种统计上合理的方法是使用标准偏差截止值。
例如,删除任何结果 +/-3 标准偏差。
使用“最大 10%”之类的规则是没有意义的。如果没有异常值怎么办?无论如何,10% 规则会消除一些数据。不可接受。
识别异常值的另一个标准测试是使用 LQ(1.5IQR) 和 UQ(1.5IQR)。这比计算标准差要容易一些,而且更通用,因为它不会对来自正态分布的基础数据做出任何假设。
您所说的“平均值”实际上称为“平均值”。
它并不能完全回答您的问题,但不受异常值影响的不同统计数据是中位数,即中间数。
{90,89,92,91,5} mean: 73.4
{90,89,92,91,5} median: 90
这可能对你有用,我不知道。