我想学习方差分析。在我开始学习算法是如何工作的(必须进行哪些计算)以及它为什么工作之前,我首先想知道我们用 ANOVA 实际解决了什么问题,或者我们试图回答什么答案。换句话说:算法的输入和输出是什么?
我确实了解我们用作输入的内容。我们有一组数字。每个数字都带有一个或多个分类变量(也称为“因子”)的值。例如:
+------------+------------+-------+
| factor 1 | factor 2 | value |
+------------+------------+-------+
| "A" | "a" | 1.0 |
| "A" | "a" | 2.4 |
| "A" | "b" | 0.3 |
| "A" | "b" | 7.4 |
| "B" | "a" | 1.2 |
| "B" | "a" | 8.4 |
| "B" | "b" | 0.4 |
| "B" | "b" | 7.2 |
+------------+------------+-------+
是否可以说 ANOVA 计算零假设的 p 值,表明这些因素对值的平均值没有影响?换句话说,我们将上述给定数据提供给算法,结果我们得到原假设的 p 值?
如果是这种情况,我们实际使用什么度量来计算 p 值。例如,我们可以说,在 1% 的情况下,假设零假设 M 可能与观察到的假设一样高(甚至更高)。什么是M?
我们不是也单独研究方差分析中的因素吗?ANOVA 可以说 factor_1 有影响但 factor_2 没有?ANOVA 可以说,对于对应于值“A”、“B”和“C”的给定因子值在统计上无法区分(例如,具有相同的均值)但值“D”有影响吗?