机器算法验证 - McNemar 检验或 T 检验，用于测量匹配的前后检验结果的统计显着性 - 吾爱随笔录

我对选择适当的统计测试有疑问，如下所示：

我有一群人参加培训课程，以衡量培训课程是否有效地提高了参加者的知识。我们做了以下事情：

前测和后测都有完全相同的问题，测试用条形码标记，以便我们能够追踪哪些前测和后测是一对。

通过进一步分解研究问题，可以分为两个部分：

1.培训是否普遍有效

2. 培训能否提高对特定问题（项目）的回答

对于问题1，我认为配对t检验比较合适：我们标记所有测试，每个参加者都会有一个前测和后测分数，我们分别取前测和后测分数的平均值，然后进行配对 t 检验。

对于第 2 题，起初我正在考虑做一个 McNemar 的测试：因为前测和后测中每个问题的答案都可以匹配。我打算做这样的事情。但是后来我收到了一些替代方法，我不确定它是否合适：

当我第一次看到它时，我想知道如何“配对”每个问题，因为分类数据已经转换为连续数据。也许提议者不小心添加了“pair”这个词，他实际上只表示“t-test”。但我仍然想知道为什么要丢弃基于配对的信息。

这里有几个问题：