主要是研究设计,也许是更少的统计数据。
假设
您的数据可能会导致尝试回答以下问题:
- 接口A比接口B更容易理解吗
- 使用以前的界面的经验是否改善了第二次运行
- 如果您先尝试系统A,然后再尝试系统B,这有关系吗?
据我了解,您想回答第一个问题,但担心 2 和 3 会模糊数据。现在我认为没有什么好的方法可以解释如何解释 3 不是 1 的一部分,我建议你避免研究的交叉设计,因为你缺乏这部分的知识。在现实世界的设置中,用户也将只有一个界面可以关联。
结果
你的结果变量是
定义哪个结果变量是您的主要变量,并且您应该将其用于所有功率计算,这始终是一种很好的做法。如果您有几个任务要比较,我建议您创建一些复合变量(最好是直观的)。
在选择主观体验时,您应该寻找经过验证的问卷。使用已经存在的问卷总是好的,在医学中,我们经常使用我们之前验证过并且大多数人都熟悉的EQ-5D等分数。可能有类似的可能可以用于您的情况。分数有一个很好的特点,那就是你可以计算一个平均值,但这也是一个缺点,因为如果你不能与分数联系起来,10 分的提高就没有任何意义。在 EQ-5D 中,我们经常将手术结果与普通人群进行比较,看看我们的干预措施有多接近。
设计
我会做一个没有交叉的随机试验。随机化的重要一点是……它必须是随机的!是的,有很多人偷看信封破坏了他们自己的实验,所以请确保你有一个好的随机化程序:
- 使用计算机随机化或不透明信封
- 使用块状随机化,以便您的目标是相同的组大小(每个块具有 50% 的 A 组和 50% 的 B 组)
- 使用随机块大小,如果你有 2、4 和 6 的大小,你将很难知道下一个接口是什么
- 仅对 1 个或 2 个变量使用分层,例如性别、计算机经验
- 较晚随机化,最好是在受试者坐在电脑旁时
如果有关系统的消息四处流传,您可能需要检查一下系统的先前知识。如果你招收你的同学,你可能会因为意外破坏实验而告诉他们你系统的重要部分。出于显而易见的原因,你不能让你的受试者失明,但你应该尽你所能,让受试者不知道他们将要经历什么。
混杂因素
如果您的随机化有效,则无需担心混杂因素。即使理论说你不需要为他们的主题记下可能的混杂因素,以防随机化无法解决问题。如果您的小组非常小,少于 20-30 个科目,您可能也想做同样的事情。
在您的情况下,典型的混杂因素可能是:
功率计算
计算能力(估计需要的科目数量)很容易,除非你想详细了解,我用 Russ Lenth 的能力计算做了我的第一次计算,你可以在这里找到。你也可以使用 R 的包“pwr”,你可以在这里找到一些帮助。
功率计算是一个非常粗略的估计,您应该始终为辍学增加 10-20 %。在医学中,我们使用 0.05 的显着性水平,并且按照传统的目标是 80% (0.8) 的功效,但选择界面可能不如为癌症患者选择药物 A 重要,因此可以只考虑 0.1 的显着性。
在尝试计算功率时,您必须进行很多猜测,这是您应该将数字视为指导而非事实的原因之一。我还认为,如果您每组需要超过 60-80 名受试者,那么您寻找的差异可能非常小,如果您正在寻找更好的心脏药物,这可能是可以的,但如果您的设计界面不那么有趣。
统计数据
如果你有一个精心设计的研究,这部分是你最不担心的。我想说,大多数缺陷都存在于研究设计中,并且统计测量通常在小数点上有所不同,而结论通常保持不变。
随机试验的测试:
对于测试混杂因素:
- 回归分析是一种非常强大的方法,它几乎可以让你做任何事情。
为了学习统计背后的基础知识,我使用了我也向所有学生推荐的可汗学院。