如何预测要收集多少数据?

机器算法验证 置信区间 实验设计 统计能力
2022-04-07 14:46:17

我目前正处于一个实验的计划阶段,我希望能在合理的时间范围内(理想情况下少于 6 个月)检测到 0.155% 的信号变化(相对幅度)。我计算出(可用)数据的速率约为每天 68 个事件,但应该强调这是一个随机变量。现在我正在尝试计算运行检测器需要多少天才能看到变化的置信水平为3σ?

其他一些可能(或可能不)相关的细节包括:信号的变化预计为正弦曲线,周期为 0.5 天。出于这个原因,我将有用事件率降低到 34(即一半),因为当正弦信号处于或接近平均值时,显然没有变化。

我一直在寻找一种方法来预测查看如此小的信号变化所必需的数据集的大小,但没有提出任何结果。我将非常感谢任何人可以提供的任何提示/提示。

编辑:非常感谢@shabbychef,我觉得这个问题现在已经在physics.SE 上得到了令人满意的回答

1个回答

如果您可以将问题以 t 检验的形式提出,则可以使用 Lehr 规则来估计所需的样本量。对于 0.05 水平的 2 面、一个样本 t 检验,通过使用可以实现 0.80 的功效n=8/Δ2, 在哪里Δ是“信噪比”(均值除以标准偏差)。我不知道你的意思是不是 0.155%,但如果是这样,你正在看大约 10 万年!