我正在编写一个分析进程运行时间的脚本。我不确定它们的分布,但我想知道一个进程是否运行“太长”。到目前为止,我一直在使用上次运行时间的 3 个标准偏差(n>30),但有人告诉我,如果数据不正常(看起来不正常),这不会提供任何有用的信息。我发现另一个异常值测试指出:
求四分位数间距,即 IQR = Q3 - Q1,其中 Q3 是第三个四分位数,Q1 是第一个四分位数。然后找到这两个数字:
a) Q1 - 1.5*IQR b) Q3 + 1.5*IQR
如果 < a 或 > b,则该点为异常值
我的数据往往是 2 秒、3 秒、2 秒、5 秒、300 秒、4 秒……,其中 300 秒显然是一个异常值。
哪种方法更好?IQR 方法还是标准偏差方法?