利用许多预处理测量

机器算法验证 混合模式 实验设计 重复测量 面板数据
2022-03-19 03:07:29

我正在计划一项包含大量治疗前测量的治疗前控制设计研究。我将受试者分为对照组和治疗组。对于两组,我将在治疗开始前收集一年的每小时数据,然后继续收集另一年的数据。这将为每个受试者产生大约 9000 次治疗前测量和 9000 次治疗后测量。

治疗是一旦开始就无法停止的事情,所以交叉设计只能是AA/AB的形式,它不会利用这种设计的好处。

心理和生物医学文献建议使用 ANCOVA 模型,其中预处理数据用作模型中的协变量。将 9000 个协变量放入模型中似乎完全荒谬。此外,将预处理数据简化为汇总统计数据并没有利用大量测量值。

我敢肯定,这一定是以前提出的,有什么想法吗?参考已发表的结果将特别有帮助。

2个回答

这不是一个完整的答案,而只是一些想法:

  • 更多的预处理措施应该会增加您测量基线差异的可靠性。提高测量基线差异的可靠性应该会增加您在使用前后控制设计检测组差异(假设存在实际效果)方面的统计能力。

  • 9000个预处理措施很多。这样的设计通常意味着您对某些现象的时间动态感兴趣。尽管如此,如果您只是将测量值用作基线差异的指标,那么将有许多策略可以将其合并到您的模型中。

    • 最简单的策略是为每个参与者取平均值。
    • 如果参与者数据有趋势,那么在干预之前对个人得分的估计可能会更有趣。
    • 更复杂的是,根据使用预处理措施的一些预测,为每个人开发一个模型,说明他们在干预后因变量的得分是多少。如果存在某种形式的季节性或其他系统性效应以不同的方式对不同的个体起作用,这可能更相关。

您可能还想阅读有关分析此类设计的策略的早期问题

原谅我之前的帖子。我现在看到您指的不是 9000 个不同的协变量。

我写的不适用于你的情况。

最诚挚的歉意。

保罗

有很多关于预处理协变量的匹配和降维的讨论可能值得研究 - 即通过逻辑回归的倾向加权和建立预处理协变量相对于不同匹配方法的平衡。

请参考以下........ http://gking.harvard.edu/matchit

这种方法很容易在 r 中执行,但是您希望使用的变量数量不太可能起作用。

干杯保罗