我建议进行一项小型医学研究(两组,治疗是一个虚拟变量),即 2x2 列联表。我在比较培生的价值测试和非参数竞争对手McNemar's测试。
编辑
答案带来了一个额外的问题:
他们将第 1 组中的每个病例与第 2 组中的 4 个对照匹配(根据他们认为重要的所有变量进行匹配,例如性别、年龄、hemisf),但治疗除外。撇开匹配是否完成的问题(即是否确实确定了所有重要变量),每个案例对应四个对照(即不是一个)这一事实是否人为地夸大了结果的重要性?(他们仍然要给我发部分数据,这就是为什么下表没有反映这个 4 比 1 的比例)。
我得到以下(非常不同的)结果(n = 116)(R CrossTable()函数)。:
[,1] [,2]
[1,] 39 9
[2,] 49 19
所有表格因素的统计数据
带有 Yates 连续性校正的 Pearson 卡方检验
Chi^2 = 0.844691 df = 1 p = 0.3580586
具有连续性校正的 McNemar 卡方检验
Chi^2 = 26.22414 df = 1 p = 3.039988e-07
计数数据的 Fisher 精确检验
样本估计优势比:1.672924
替代假设:真实优势比不等于 1 p = 0.279528 95% 置信区间:0.6356085 4.692326
McNemar 是近似版本,但确切版本给出了相同的结论(强烈拒绝零)。
我的问题是:我怎么能理解两者之间的如此大的差异和麦克尼马尔?