我需要一些关于适当汇集水平的指导,以用于时间序列数据的均值测试差异。我担心临时的和牺牲的伪复制,这似乎在这个应用程序上很紧张。这是指月经研究而不是操纵性实验。
考虑一个监测练习:一个传感器系统测量整个池塘宽度和深度的许多位置的溶解氧 (DO) 含量。每个传感器的测量值每天记录两次,因为已知 DO 每天都会变化。这两个值被平均以记录每日值。每周一次,将每日结果在空间上汇总,以得出整个池塘的单个每周 DO 浓度。
这些每周结果会定期报告,并进一步汇总 - 每周结果平均得出池塘的每月 DO 浓度。将每月结果平均得出年度值。年平均值本身是平均的,以报告池塘的十年 DO 浓度。
目标是回答以下问题:X 年池塘的 DO 浓度与 Y 年的浓度是更高、更低还是相同?过去十年的平均溶解氧浓度是否与前十年不同?池塘中的 DO 浓度响应于大量输入,因此变化很大。需要进行显着性检验。方法是使用 T 检验比较均值。鉴于年代值是年值的平均值,而年值是月值的平均值,这似乎是合适的。
问题来了——您可以根据每月 DO 值或年度 DO 值计算十年平均值和这些平均值的 T 值。平均值当然不会改变,但置信区间的宽度和 T 值会改变。由于使用每月值获得的 N 高出一个数量级,如果你走这条路,CI 通常会大大收紧。这可以给出相反的结论,而不是使用关于观察到的平均值差异的统计显着性的年度值,对相同的数据使用相同的测试。 对这种差异的正确解释是什么?
如果您使用每月结果来计算十年均值差异的测试统计数据,您是否与时间伪复制发生冲突?如果您使用年度结果来计算十年测试,您是否会牺牲信息并因此进行伪复制?