当您在流行病学研究中未能找到关联时,该得出什么结论?

机器算法验证 流行病学 因果关系 混杂
2022-03-29 10:39:58

通常,当有人在流行病学研究中发现关联时,人们会很快指出,这并不能证明因果关系,存在缺少联合创始人的问题,最好的情况是产生假设,最坏的情况是虚假的。这导致人们不太重视流行病学研究中发现的关联。

如果反过来呢?假设我已经有了一个理论,也许有一些早期的小型研究来支持它,甚至对这种效果有一个很好的理论解释。然后我进行了一项大规模的、有力的流行病学研究,但未能找到理论预测的关联。我现在可以给结果增加多少重量?

尽管这只是一项流行病学研究,但直觉上在我看来,结果将是非常糟糕的。但我早就学会了在统计数据方面不要相信自己的直觉。

流行病学研究中发现的所有关联弱点是否也适用于您无法找到关联时?

3个回答

是的,流行病学研究中发现的关联弱点也适用于未能找到关联。您已经消除了第一个问题,即研究动力不足,所以目前我们只是在谈论偏见。两个问题可能意味着您的研究未能找到真正的关联:

  • 令人困惑在某些情况下,混杂变量会将结果推向空值。对于积极影响,这是与暴露和结果负相关的混杂变量。对于负面影响,相反。根据混杂的强度,这很容易将真正的关系向下推,以至于你找不到它。
  • 分类错误非差异错误分类是指您研究中的每个人都有相同的概率属于错误的类别。倾向于将估计推向零。特定类别更容易被错误分类的差异错误分类可以推动结果接近远离零点。

所以不,单项研究的结果不应该被视为因果关系的明确“证据”。

我认为值得区分问题的几个方面:

  • 精确:如果您有更大的样本量,您通常能够更精确地估计参数,无论您是在频率学意义上用较小的置信区间来定义,还是在贝叶斯意义上用较小的置信区间来定义。因此,如果您使用更大的样本进行流行病学观察研究,您将更准确地描述感兴趣参数的大小。无论参数是简单的相关系数还是具有许多其他预测变量的更广泛模型中的回归系数,这都是正确的。无论感兴趣的参数是来自观察性研究还是实验性研究,这也是正确的。因此,例如,您可能会非常准确地估计吃巧克力和体重指数之间的相关性。关联,无论是否有因果关系,

  • 泛化:但是,即使您知道特定样本中参数的值,仍然存在泛化问题。在流行病学中,有很多与跨时间、文化、社会群体等的概括相关的问题。通常我们有理论和经验证据来指导我们进行这个概括的过程。例如,我们可能会争辩说,在合理的时间段内概括巧克力-BMI 关联是安全的,但可能在不同国家/地区它更复杂,可能是因为不同的饮食和锻炼习惯等。

  • 因果关系与关联:但是,您似乎对因果推理特别感兴趣。在基本层面上,观察性研究中不存在关联并不能证明不存在因果关系,正如观察性研究中存在关联并不能证明因果关系一样即使观察性研究表明巧克力和 BMI 之间没有关系,这也不会阻止实验研究表明,当孩子们吃更多的巧克力时,他们会增加体重。观察性研究中的关联或缺乏关联可能会提供有关因果过程的信息,但它不是确定的。你仍然需要认真思考理论化的潜在因果过程。

嗯,在物理学中,我们非常习惯于你所说的话,至少对我来说,实际上发生这种情况时比某些研究人员证实理论时更令人兴奋。在这些情况下,您只需报告:您没有发现理论预测的证据

在检查了你的结果和你的研究可能存在的缺陷之后,详细说明(至少在定性上)你自己对为什么理论在你的案例中失败的猜测也是一种很好的做法。