备忘单方差分析字母汤和回归等价物

机器算法验证 回归 方差分析 混合模式
2022-01-29 13:10:30

我是否可以帮助我完成这个暂定(正在进行的)尝试来了解我对 ANOVA 和 REGRESSION 等价物的了解?我一直在尝试调和这两种方法的概念、命名法和语法。这个网站上有很多关于它们的共性的帖子,例如thisthis,但是在开始时有一个快速的“你在这里”地图仍然很好。

我计划更新这篇文章,并希望得到帮助纠正错误。

单向方差分析:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

双向方差分析:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

双向因子方差分析:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

安科瓦:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

方差分析:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

曼科瓦:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

因子(或主题)方差分析:(代码here

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT:(代码在这里

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

嵌套设计:(代码在这里

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

有用的网站:

  1. 雷克斯回购
  2. 个性项目
  3. 快速-R
  4. R-Bloggers
  5. M. Crawley 的嵌套分析和裂图
  6. 具有多个随机效应的模型
  7. 裂区模型
  8. M. Crawley 的 R 书
  9. 组内和重复测量
  10. 在 R 中重复测量
  11. GLMM 常见问题
1个回答

不错的清单,安东尼。以下是一些小建议:

单向方差分析:IV 是具有 3 个或更多级别的 FACTOR。您还可以在此条目中添加示例数据:mtcars 。(类似地,您可以在所有条目中添加 *Example Data 语句,以便更清楚地了解您正在使用的数据集。)

双向方差分析:为什么不使用 IV1 和 IV2 并声明两个自变量应该是每个至少有两个水平的因子?您目前陈述的方式表明双向方差分析可能包含两个以上的自变量(或因子),这是没有意义的。

对于双向方差分析,我将区分这两种子情况:1. 对 IV1 和 IV2 具有主效应的双向方差分析和 2. 在 IV1 和 IV2 之间具有交互作用的双向方差分析。这第二项是您将两项称为阶乘双向方差分析。)描述这两个子情况的更好方法是:1. IV1 对 DV 的影响独立于 IV2 的影响和 2. IV1 的影响在 DV 上取决于 IV2。您还可以更清楚地说明,在回归设置中虚拟编码的是自变量 IV1 和 IV2。

对于 ANCOVA,您可以澄清您在当前示例中仅考虑单向 ANCOVA。为了完整起见,您可以添加一个双向 ANCOVA 示例,其中 IV1 和 IV2 之间没有交互作用,而一个具有这两个变量之间交互作用的示例。

对于以上所有内容,您还可以添加一个名为Purpose的项目,它描述了这些分析何时有用。例如:

目的(单向方差分析):调查 DV 的平均值是否在 IV 的各个水平上不同。

对于 MANOVA,您能否澄清一下需要 (a) 两个或更多 DV 和 (2) 一个或多个作为因子的 IV?我想您可以区分单向 MANOVA(具有 1 个因子)和双向 MANOVA?曼科瓦也是如此。

因子内方差分析也称为重复测量方差分析,因此也许您可以将此术语添加到熟悉它的人的列表中。澄清混合效应建模为重复测量数据建模提供了另一种方法也将有所帮助。否则,读者可能不会理解这两种方法之间的区别。