为什么风险比的置信区间不对称?

机器算法验证 分布 数理统计 置信区间 生物统计学 冒险
2022-03-29 23:43:55

我的理解是风险比的置信区间应该关于平均值对称(下限和平均值之间的距离与平均值和上限之间的距离相同)。但通常当我在已发表的临床试验文献中看到风险比时,情况并非如此。

例如,一项研究报告 HR,0.69;西妥昔单抗加 FOLFOX-4 与 FOLFOX-4 相比,mCRC 的 95% CI,0.54 至 0.89 可在此处找到:https ://www.ncbi.nlm.nih.gov/pmc/articles/PMC7044820/pdf/bmjopen-2019-030738 .pdf

下限和平均值之间的距离是 0.69 - 0.54 = 0.15,而平均值和上限之间的距离是 0.89 - 0.69 = 0.20。两者的距离不应该是 0.15 对称吗?

3个回答

我的理解是风险比的置信区间应该关于平均值对称(下限和平均值之间的距离与平均值和上限之间的距离相同)。

这是不正确的。危险比没有理由是对称的。(原则上它们在特定情况下可能是对称的,例如,如果点估计为 - 但它们通常不是对称。)1.0

这是一个论点。维基百科说:

在最简单的形式中,风险比可以解释为研究中事件发生在治疗组中的机会除以事件发生在控制组中的机会,反之亦然。

现在,请注意,一只手臂是否被视为“治疗”而另一只手臂被视为“控制”,这完全取决于解释。我们可以随意切换标签。而这种转换会将风险比变成它的倒数,HR=1HR

如果现在,风险比 CI 总是对称的,那么这种倒置将需要尊重这种对称性。因此,CI 需要转换为对于也是对称,或者 但这通常在数学上是不可能的。取倒数不是对称运算。(rϵ,r+ϵ)HR(1r+ϵ,1rϵ)HR1r

1r+ϵ=1rδ,1rϵ=1r+δ.

只是我们习惯于对称置信区间,因为这是最典型/最常见的情况:具有高斯分布误差的某种线性回归的情况。

但是......没有一个唯一的置信区间。任何有 95% 置信度的地区都可以。

通常人们会选择某种意义上最小的区域。例如,通过使用假设检验(置信区间可以看作是假设检验的一个区域),它根据具有最高概率密度的区域计算 p 值。

示例 1

下面是这个问题的一个例子,它显示了指数分布的人口该估计基于观察到的样本均值您可以看到置信区间边界(粗黑线)围绕估计值(虚线)不对称。这有两个原因。λx¯

  • 的估计值不是观察到的的线性函数。λ^x¯
  • 对于给定的参数的样本分布不是对称的。x¯λ

示例 2

一个非常明显的例子是二项分布的估计。p

假设你估计一个瓮中红球和蓝球的数量。如果在某些样本中您观察到零个红球,那么对红球数量的估计将为零,但置信区间将不是对称的(或不应该是对称的),否则您将包含负值。

示例 3

Christoph Hanck在上一个链接问题中的回答显示了高斯分布的示例以及置信区间如何变成对称的。

但是,如果您转换计算间隔的参数,那么它将再次变得非对称。风险比可能就是这种情况。

用于拟合生存模型的对数(部分)似然最大化方法在对数危险量表中工作。回归系数估计在那个尺度上,在那个尺度上,估计的协方差被假定为多元正态。因此,在对数危险量表中,置信区间 (CI) 是对称的。

当您对这些系数和相应的 CI 限制取幂以获得风险比 (HR) 方面的结果时,CI 必然是不对称的。对于通常的对数风险比为 0 或 HR 为 1 的零假设假设也是如此。例如,如果对数风险比估计的 CI 为 (-0.2, +0.2),点估计为 0 ,在(指数化的)HR 尺度中,CI 为 (0.8187, 1.2214),关于 HR = 1 的点估计不对称。

更广泛地说,正如其他答案很好地证明的那样,CI 根本不需要对称。当可以假设系数估计具有对称分布时,它们通常被认为是对称的,但即便如此,也没有规则要求这种选择。任何包含 95% 概率分布的区间均可视为 95% CI。