什么是实验设计中的块?

机器算法验证 相互作用 解释 实验设计 阻塞
2022-01-21 18:59:48

关于实验设计中块的概念,我有两个问题:(1)块和因子有什么区别?(2)我尝试读了一些书,但有些不清楚:似乎作者总是假设“块因素”与其他因素之间没有相互作用。对吗?如果是,为什么?

4个回答
  1. 块是一个因素。与非阻塞设计相比,阻塞的主要目的是减少设计的无法解释的变化我们对块效应本身不感兴趣,而是在我们怀疑背景“噪声”会混淆实际因素的影响时进行块。 我们将实验单元分组到“同质”块中,其中主要因素的所有级别均等表示。随机控制区组设计的方差分析将等效单因素完全随机设计的残差项拆分为区组和残差分量。然而,我们应该注意到,与单因素 CR 设计相比,后一个组件的自由度更低,导致更高的估计值(SSResidual)
    MSResidual=SSResidual/d.f.
    当我们认为残差的减少将超过 df 的减少时,应该做出阻止或不阻止的决定

  2. 通常加性模型适合 RCB 设计数据,其中响应变量是因子和块效应的加性组合,并假设两者之间不存在交互作用。我认为这是因为 RCB 无法让我们将交互 BxF 与块内变异性和实验单元内的变异性区分开来。底线是我们必须假设没有交互,因为我们无法衡量它。不过,我们可以通过视觉或 Tukey 的测试来测试它是否存在。

关于实验设计的一个很好的资源是this

这是一个简洁的答案。在大多数处理实验设计的文件中可能会找到很多细节和示例;尤其是在农学方面。

通常,研究人员对块效应本身并不感兴趣,但他只想考虑块之间响应的可变性。因此,我习惯将块视为具有特定作用的因素。值得注意的是,块效应通常被认为是随机效应。最后,如果您期望“治疗效果”因块而异,则应考虑交互作用。

这是我最喜欢的解释的释义,来自我的前任老师 Freedom King。

您正在研究面包面团和烘烤温度如何影响面包的味道。你有一个美味的评级量表。假设您从某个食品公司购买包装好的面包面团,而不是自己混合。每条烤面包都是一个实验单元。

假设您有 2 个面团和 8 个温度,您可以一次在烤箱中放入 4 个面包,并且您想要运行面包。n=160

完全随机 阶乘布局(无块)中,您将完全随机地决定面包烘烤的顺序。对于每条面包,你都要预热烤箱,打开一包面包面团,然后烘烤。这将涉及运行烤箱 160 次,每条面包一次。2×2

或者,您可以将烤箱运行视为阻塞因素在这种情况下,您将运行烤箱 40 次,这可能会加快数据收集速度。每个烤箱运行将有四个面包,但不一定每个面团类型两个。(确切的比例将随机选择。)每个温度您将运行 5 次烤箱;这可以帮助您考虑相同温度烤箱运行之间的变化。

更棒的是,你可以用面团和烤箱挡住。在此设计中,您将在每个烤箱运行中每种类型的面团中恰好有两个。

当我有时间仔细考虑时,我会为这些实验设计使用适当的花哨名称进一步更新它。

实验设计是三种结构的组合:

  1. 治疗结构:治疗是如何由感兴趣的因素形成的?
  2. 设计结构:实验单元如何分组和分配给治疗?
  3. 响应结构:如何进行观察?

块是属于设计结构的“因素”(为了区分,将它们称为“阻止因素”与“处理因素”并不是一个坏主意)。它们是令人讨厌的参数的好例子:您必须拥有的模型参数以及您必须考虑其存在,但其值并不是特别有趣。请注意,这与因素的性质无关——阻断因素可能是固定的或随机的,就像治疗因素可能是固定的或随机的一样。

关于一个因素在实验设计中的位置,我个人的经验法则是:如果我想估计与该因素相关的参数并在该因素或其他因素参数内比较它们,那么它属于处理结构。如果我不关心相关参数的值,也不关心比较它们,则该因素属于设计结构。

因此,在此线程其他地方的面包示例中,我不得不担心运行之间的差异。但我不在乎比较 Run 1 和 Run 24。Oven run 属于设计结构确实想比较两个面团配方:配方属于治疗结构。我关心烤箱温度:这也属于处理结构。让我们建立一个实验设计。

设计结构有一个因素(烤箱运行、运行),处理结构有两个因素(配方和温度)。因为每次运行都必须是单个(标称)温度,所以温度和运行必须在实验设计的同一水平上发生。但是,每次运行中有 4 个面包的空间。显然,我们可以选择每次烘烤 1、2、3 或 4 个面包。

如果我们每次运行烤一个面包,并随机化食谱展示的顺序,我们会得到一个完全随机化设计 (CRD) 结构。如果我们烤两个面包,每次运行每个食谱一个,我们就有一个随机完整块设计 (RCB) 结构。请注意,每个配方都出现在每次运行中,这一点很重要。如果没有这种平衡,配方比较将受到运行差异的影响。请记住:阻塞的目标是摆脱 Run 差异. 如果我们每次运行烤三个面包,我们可能会发疯:3 不是 160 的因数,所以我们会有一两个不同大小的块。另一种合理的可能性是每次运行四个面包。在这种情况下,我们将在每次运行中烘烤每个食谱的两个面包。同样,这是一个 RCB 结构。我们可以使用每次运行中每个配方的两个面包之间的差异来估计运行内的可变性。

如果我们选择其中一种 RCB 设计结构,温度效应在运行级别是完全随机的。配方嵌套在温度中,并且具有与温度不同的错误结构,因为每个面团都会出现在每次运行中。通过面团非相加性(相互作用)查看配方和配方的对比在它们中没有运行到运行的可变性。从技术上讲,这被称为裂区设计结构或重复测量设计结构。

调查员会使用哪个?可能带有四个面包的 RCB:40 次运行 vs 80 次运行 vs 160 次承载了很多重量。然而,这可以修改——如果关注的是家庭烤箱而不是工业生产,如果相信家庭面包师很少烘烤多个面包,那么很可能有理由使用 CRD。