我想测试新技术机器是否可以使人们在家中消耗更少的水。
我有大约 150 台这样的机器,它们可以分为 3 种技术(A、B、C),即每种 50 种。
我想对这 150 个人进行配对 t 检验,即测量他们在机器安装前后的平均用水量。
我考虑过进行 3 个单独的配对 t 检验,每种技术一个来测试每种技术。但也是对所有 150 的配对 t 检验(不考虑类型)。
但是,我想确保最终,我有统计上显着的结果。我希望最终有一个置信区间和误差范围。50 的样本量是否足以进行配对 t 检验?
我知道我必须假设平均差异将遵循正态分布。我搜索了有关获得最小样本量的信息,发现我们需要将平均差的标准差以及总体平均值的差的估计值作为输入。
由于我不知道用水量到底是多少,我该怎么做?也许有一些试点研究可以让我得到标准偏差估计,但这是否足够?
我看到这篇文章什么是配对 t 检验的最小样本量,如果数据不正常,什么是非参数等价物?,但我的问题仍然存在。
另外,如果正态分布假设最终被证明是错误的,我最终可以转向 Wilcoxon 符号秩吗?
另一个困扰我的问题是,与双向 ANOVA(例如)等测试相比,为什么配对 t 检验中的样本量要低得多?我看到大小为 30 的配对 t 检验,而双向 ANOVA(与对照组)大约 > 200?
编辑 1:我应该像我描述的那样进行配对 t 检验,还是应该对对照组(150 人)和我的测试组(150 人)进行 ANOVA 检验?对于他们两个,由于我只有 150 台机器,我猜我的样本量是预定义的,但我如何确保我的测试具有意义,即 95% 的置信度和一定的误差范围?
编辑2:我是否必须考虑效果大小或测试的力量?我读过,如果我与几个人(例如 8 人)进行试点研究,研究表明安装这些机器之前和之后(配对)的消耗,我可以计算效果大小
然后我可以继续使用软件 R,例如,确定样本量。例如,如果效果大小 = 0.47,显着性水平 = 0.05,功效为 80%,我会得到:
pwr.t.test (d=0.47, sig.level =0.05, power=0.80, type="paired", alternative="greater")
返回对。
所以我猜这真的取决于效果大小,为此,我需要一个试点研究。