随着时间的推移对一系列数据进行统计检验

机器算法验证 时间序列 统计学意义
2022-03-26 09:28:45

我有一组数据可以查看特定程序在一段时间内产生的“命中”次数。数据可追溯到 2010 年 9 月,包括截至 2011 年 3 月的数据,因此数据点为月度数据。我想看看最新数据(2011 年 3 月)是否显示该程序的“点击”数量在统计上显着减少。

我有一种感觉,可能没有一个测试可以完美地适合这个,因为数据有点有限。我还可以在同一时间范围内每周提取数据,这将建立 31 个点(此时我仍然想查看最近的单元进行比较)。到目前为止,还没有为这些数据建立人口平均值,因为数据只能追溯到 2010 年 1 月(但那时的数据并不可靠)。

作为参考,仅 9 周的数据(正如我首先提取的那样)显示平均值 = 1013.67 n=9 st.dev= 53.57 最近一周 = 991

只是目测它在“点击量”下降方面似乎没有统计学意义,但是我需要每隔几周进行一次分析,并想知道是否有可靠的东西可以使用。提前感谢您的输入!

2个回答

正如 GaBorgulya 指出的那样,需要有一个模型来检测潜在的异常。该模型需要生成“白噪声”误差序列或足以分离信号和噪声。有了这个基于旧数据的模型,我们就可以将新值与预测区间进行比较。这是经典的,尽管有限的方法,称为“模型外测试”。更全面的方法是包含一个“脉冲变量”,即新数据点的零和一,并使用所有数据估计增强模型的系数。然后可以从这个增强模型中的“脉冲变量”的“t 值”获得在观察之前观察到的概率(即新值)。通常,这种方法被称为干预检测,它扫描(数据挖掘)时间段以检测脉冲、电平转换、季节性脉冲和本地时间趋势已经显着明显的点。在您的情况下,您不是在寻找零假设,而只是在最后一次观察中存在潜在的变化点,即最后一个“1”时期。您的问题还建议了我们已经看到的解决方案,这些解决方案检测到最后 K 个周期的平均值发生显着变化,提醒分析师注意创新。在您的情况下,您不是在寻找零假设,而只是在最后一次观察中存在潜在的变化点,即最后一个“1”时期。您的问题还建议了我们已经看到的解决方案,这些解决方案检测到最后 K 个周期的平均值发生显着变化,提醒分析师注意创新。在您的情况下,您不是在寻找零假设,而只是在最后一次观察中存在潜在的变化点,即最后一个“1”时期。您的问题还建议了我们已经看到的解决方案,这些解决方案检测到最后 K 个周期的平均值发生显着变化,提醒分析师注意创新。

如果数据不到一年,就不可能解释任何类型的年度季节性影响。(例如,如果您的数据与购物相关,您可能会有年假,可能一年两次销售等)

您可能想看看像http://en.wikipedia.org/wiki/Control_chart这样的统计过程控制工具?