在(大部分)分析化学文献中,用于检测单变量数据中异常值的标准测试(例如,某些参数的一系列测量值)是 Dixon 的 Q 测试。总是,教科书中列出的所有程序都会让您从数据中计算一些数量,以便与表格值进行比较。手动,这不是什么大问题。但是我打算为 Dixon Q 编写一个计算机程序,仅仅缓存值让我觉得不雅。这让我想到了我的第一个问题:
- Dixon Q 的表格值是如何生成的?
现在,我已经查看了这篇文章,但我觉得这有点作弊,因为作者只是构造了一个样条,它通过了 Dixon 生成的表格值。我觉得某个地方需要一个特殊的函数(例如误差函数或不完整的 beta/gamma),但至少我有这些算法。
现在我的第二个问题是:ISO 现在似乎在慢慢推荐 Grubbs 的测试而不是 Dixon Q,但从教科书来看,它还没有流行起来。另一方面,这相对容易实现,因为它只涉及计算学生 t 的 CDF 的倒数。现在我的第二个问题:
- 为什么我要使用 Grubbs 的而不是 Dixon 的?
在我的案例中,很明显,该算法“更简洁”,但我怀疑有更深层次的原因。有人可以开导我吗?