如何定义队列研究?

机器算法验证 可能性 假设检验 数理统计 术语
2022-03-26 12:13:54

这里的基本问题,因为我什至没有在例如维基百科中看到它。队列研究的定义是否严格要求群体暴露/不暴露于某种事物(例如吸烟、饮酒)?如果是这样,这将是一个限制性定义。如果工人作为结果/事件的“曝光”和“任期”(短期/长期)获得的报酬更少/报酬更多呢?

3个回答

队列研究是一项观察性研究,其中每个研究参与者在两个或多个时间点根据因变量进行观察/测量。在每次观察/测量时,任何解释变量都可能会或可能不会被观察/测量。跨时间观察因变量可以测量个体参与者的变化率(随着时间的推移),并估计目标人群的平均变化率。队列研究中感兴趣的分析问题是估计的变化率是否因解释变量的值或变化率而异?

关于命名的一些要点

  • 因变量通常被称为流行病学的结果

  • 解释变量通常被称为流行病学中的暴露

  • 定义的群组意味着参与者在因变量、解释变量或两者中共享一些值。例如,暴露定义的群组可能是所有参与者在第一次观察/测量时都没有暴露的群组;他们中的一些人将在整个研究中暴露在不同的层面。结果定义的队列可能是所有参与者在第一次观察/测量时都没有结果的队列。队列研究可以根据因变量和解释变量来定义。

  • 当因变量仅取两个值(0 或 1),并且在研究开始时所有参与者都以 0 为因变量定义队列时,变化率称为发生率

  • 观察性研究意味着暴露和暴露的变化不是由研究人员随机分配的,因为他们处于随机对照试验和其他实验设计中。

这是基于网站的业务背景下的群组示例(但它可以推广到许多其他类型)。

想象一下,您在网上销售产品。您关心每天有多少人转换(即订阅)您的网站。

  • 假设在第 1 个月,有 100 人访问了您的网站,有 50 人订阅了您的网站。
  • 然后在第 2 个月,有 150 人访问了您的网站,并有 100 人订阅。
  • 然后在第 3 个月,有 125 人访问了您的网站,并有 50 人订阅。

    伟大的。您的整体转化率为50+100+50100+150+125=53%

    但这将第一个月注册的人与第三个月注册的人相同。这对你有意义吗?也许第一个月的人已经取消了他们的订阅。也许在第 1 个月到第 3 个月之间,您更改了网站,这会影响您的转化率。你不想知道吗?

    为了回答这类问题,我们将用户分成了几组。一种自然的方式(在在线业务中)是按访问网站的时间来划分。

    在这种情况下,我们将有 3 个群组 - 第 1 个月(转化率 50%)第 2 个月(66%)和第 3 个月(40%)。

    如果我分别跟踪这些用户组,我可以更好地了解我的产品变化如何影响我的用户。例如,也许第一个月的人都注册了,因为他们看到了一个很棒的广告。然后在第 2 个月,我删除了该广告,我的第 2 个月队列的转化率很差。

    群组分析在了解您的业务方面发挥着关键作用。

  • 让我们先看看术语群组最初是指在特定时期、特定地点出生并按出生时期确定的一群人。这个定义有助于确定队列中的人随着时间的推移而衰老的死亡率等因素。但是,对群组的理解要广泛得多,指的是由特定时间段地点定义的任何人群。

    队列研究是一种纵向研究,回顾性或前瞻性地检查一个队列它定义特征首先是在很长一段时间(通常是几年)内识别感兴趣的群体(通常是很多人)。

    回顾性研究设计将检查过去的一个队列,例如,在 1970 年代在 X 化学公司工作的所有女性员工。一项前瞻性研究将检查当前定义并在未来遵循的队列,例如今年在加拿大出生的每个人。在定义群组时,评估群组是否暴露于风险因素(例如,使用诱变化学品),并且随着时间的推移对其进行监测,以了解感兴趣的结果(例如,发展为癌症)。然后可以在暴露和未暴露的亚组之间进行比较(例如,癌症发病率)。