这是Statistics 101,但我不是统计学家,所以似乎无法在谷歌上找到合适的技术术语。
我的公司收集不同时间点的数据。今天的数据点与其他数据点的定位有些不同,因此我们正在争论这是否是偶然的事故或表明实际的潜在影响。你站在哪一边取决于你如何看待数据,但我们需要能够检测到这些数据。这本质上是一个阈值放置的问题。
“给定一组随时间变化的数据点,一个给定的数据点在被认为是异常之前必须有多大的不同?”,以及“一个给定的异常点是偶然发生的可能性有多大?”
这是异常值或标准偏差的简单问题吗?这个问题是否需要某种模型拟合才能解决?我最初在这里考虑 p 值和假设 - 例如,假设可疑数据点只是偶然产物的零假设,我们可以根据数据计算该零假设为真的概率吗?
我在这里什至不需要完整的答案,只需指向正确的方向即可。肯定有比目测更好的方法来决定这些事情。
