如何选择 df 进行汇总统计(例如斜率值)之间的比较?

机器算法验证 相关性 回归 统计学意义 自由程度
2022-03-20 05:48:06

为了关联或比较两个因变量的平均值。

就我而言,我需要关联来自不同条件(例如条件=4)的个人(例如科目=30)斜率值,并且每个斜率值总结了因变量之间的关系(例如在自变量的每个级别测量4次) 和自变量(例如 5 个级别)。

如何校正比较的df以反映每个数据点(斜率值)汇总了许多测量值的事实?

注意:我不是在问如何在斜率值之间进行回归。我已经在主题设计中进行了回归,最小化欧几里德距离回归等。

3个回答

我是这样理解你的问题的:

  • 你有两组参与者
  • 每位参与者五次观察
  • 基于五个观察,您可以提取单个汇总统计(例如,如果五个观察是五个时间点的性能,那么汇总统计可能是预测时间性能的回归线的斜率)

一般要点

  • 如果要检验汇总统计量上组间是否存在差异,可以进行标准自由度的标准 t 检验。
  • 对每个人进行矿石观察将提高您衡量汇总统计数据的可靠性。
  • 更高的测量可靠性意味着更大的预期组差异,因此更大的统计功效(参见可靠性衰减)。

如果不是有两组,而是对每个参与者测量一次数字变量,例如年龄,并且您希望将其与汇总统计数据相关联,则可以得出非常相似的观点。

有很多方法可以衡量一组参与者的某些东西。您只是碰巧将算法(例如,导致斜率的线性回归)应用于一组观察结果以得出您的度量。

这是一个非常简单的多级(又名分层)模型。Douglas Bate 他目前正在编写一本关于该主题的书(可在此处获取草稿:http: //lme4.r-forge.r-project.org/book/)。虽然有很多关于这个主题的书籍,但 Doug's 的另一个好处是围绕“lme”R 包进行设计,这是一个非常方便的包,旨在适应这种模型。我认为你最好去阅读那本书的第一章,并练习 R 中提供的示例。你总是可以带着更具体的问题回来。

关于您更具体的问题(即有多少自由度):问题是您有多少重复。查看R 书第 19 章的前几页,了解此类会计的示例和指南。

我们可以在这里做会计,但我不明白你的实验设计(可能是由于词汇的不同,如果你用正式的(即数学)脚本解释它可能会更容易,并小心定义索引)。

您可能还想查看以下论文 Hurlbert, SH (1984) 伪复制和生态田间实验的设计。生态专着, 54, 187–211。