一些治疗组的所有 0 响应的二项式数据分析

机器算法验证 物流 二项分布 sas 等渗
2022-03-26 07:04:22

我们进行了一系列实验,在这些实验中,我们测量了在不同时间段暴露于感染病毒的昆虫时病毒向植物的传播,因此所有实验都有相似类型的自变量和因变量。在一项实验中,有 6 个时间段(1 到 24 小时),每个时间段测试了 25 株植物(单独)。每个植物的反应是是或否(植物被评为病毒感染)。对于两个时间间隔,所有植物对病毒感染均为阴性(每个时间间隔为 0/25)。

我在 SAS 中使用 PROC GLIMMIX 进行分析。对于所有其他实验,在模型语句中使用二进制分布会给出合理的结果。对于两个时间间隔有 0 个阳性植物的实验,如果我在模型语句中使用二进制分布,则具有 0 个传输的两组的标准误差很大,从而扭曲了结果。

如果我使用负二项分布(基于病毒阳性植物的数量),结果似乎是合理的。由于每个时间间隔都测试了相同数量的植物,因此使用这种方法是可行的,但它与其他实验不同。

是否有一种方法可以调整/解释治疗组中的零点,以允许二元分布返回合理的结果?

3个回答

零的问题在于数据不排除任意小的比例。因此,必须更仔细地评估您的先前信息,因为在这种情况下它仍然很重要当先验信息被数据“淹没”时,无关紧要的细节可能很重要。在这类问题中,人口规模N变得很重要,但二项式假设N,如果在计算中过早应用此限制(如您的标准错误所示),则会给出荒谬的结果。

在这种情况下,有一个相对直接的近似值,您只需替换025127,这是基于“阳性感染”真实比例的统一先验的贝叶斯估计。鉴于您正在使用 GLIMMIX - 做任何更复杂的事情都可能会破坏您的 SAS 程序。

为了保持一致,可能值得替换所有比例rnr+1n+2- 但是它不应该过多地影响你的结果。

我相信这是一个假设单调关系是安全的实验:对于更长的展示时间,感染概率不能更小。所以你可以运行单调/等渗回归。您甚至可以将 time=0 时的感染概率为 0 纳入您的模型。

您可以尝试使用 proc 逻辑进行精确逻辑回归,但是您无法在模型中的某处指定随机效应,您现在可能会在使用 proc 混合时这样做。您必须切换到固定效果,但您可以保持二项式误差分布。