3 路还是 2 路方差分析?

机器算法验证 方差分析 分类数据 多元分析 实验设计
2022-04-05 14:23:06

我有以下数据集:

urecovery time temp acid
1     86.88   -1   -1   -1
2     88.96   -1    0    0
3     93.68   -1    1    1
4     88.92    0   -1    1
5     86.96    0    0   -1
6     91.26    0    1    0
7     88.20    1   -1    0
8     93.20    1    0    1
9     88.75    1    1   -1

其中 urecovery 是响应变量,时间、温度、酸是分类变量。值 -1 对应于级别低、0、中和 1 高。

这是三路方差分析还是二路,并非所有组合似乎都在这里进行了测试,这是否意味着这不是三路案例?

1个回答

这显然是一个设计的实验,看起来非常像是一个331连续预测变量的设计。编码表明,并且预测变量的名称表明可以定量测量的事物,或者至少可以用少量盐来处理。如果是这样:三个主要影响是正交的,每个都与其他两个预测变量之间的二阶交互作用部分混淆;每个二次效应与其他两个预测变量正交;& 没有真正的重复。目的可能是获得对主效应的独立估计,残差有 5 个自由度,同时允许在没有相互作用的自信假设下分别对每个预测变量进行曲率独立检查。也许估计部分或全部二次项,注意包含temp平方项不会影响系数估计acidtime

这样的设计并不太常见。很少单独关注每个预测变量中的曲率,但不关注预测变量之间的相互作用。更常见的是,您会看到一个完整的因子设计(对于三个预测变量的情况——当有更多预测变量时为部分因子)以及一些用于检查曲率并提供纯误差估计的中心点;必要时添加一个正交的轴向点块(加上更多的中心点)以允许估计二次效应。

如果您确定要将每个预测变量视为分类变量,那么您能做的最好的事情就是只拟合主效应(仍然是正交的),正如@January 指出的那样,残差只剩下 2 个自由度。