机器算法验证 - 阳性和阴性预测值的统计检验 - 吾爱随笔录

阳性和阴性预测值的统计检验

机器算法验证流行病学列联表 p 值

2022-03-03 02:09:42

我正在阅读一篇论文，看到一张表格，其中比较了 PPV（正预测值）和 NPV（负预测值）之间的比较。他们为他们做了某种统计测试，这是表格的草图：

PPV    NPV    p-value
65.9   100    < 0.00001
...

每行都指一个特定的列联表。

他们做了什么样的假设检验？谢谢！

2个回答

假设如下所示的交叉分类（此处为筛选工具）

替代文字

我们可以定义筛选准确性和预测能力的四种衡量标准：

敏感性(se), a/(a + c)，即在存在疾病的情况下筛查提供阳性结果的概率；
特异性(sp), d/(b + d)，即在不存在疾病的情况下筛查提供阴性结果的概率；
阳性预测值（PPV），a/（a+b），即检测结果为阳性的患者被正确诊断（为阳性）的概率；
阴性预测值（NPV），d/（c+d），即检测结果为阴性的患者被正确诊断（为阴性）的概率。

每四个度量都是根据观察数据计算的简单比例。因此，合适的统计测试将是二项式（精确）测试，它应该在大多数统计软件包或许多在线计算器中都可用。检验假设是观察到的比例是否显着不同于 0.5。然而，我发现提供置信区间比提供单一显着性检验更有趣，因为它提供了有关测量精度的信息。无论如何，为了重现您显示的结果，您需要知道双向表的总边距（您只给出了 PPV 和 NPV 作为百分比）。

例如，假设我们观察到以下数据（CAGE 问卷是酒精筛查问卷）：

替代文字

然后在 R 中，PPV 将按如下方式计算：

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831

如果您使用的是 SAS，那么您可以查看使用说明 24170：如何估计敏感性、特异性、阳性和阴性预测值、假阳性和阴性概率以及似然比？.

为了计算置信区间，高斯近似值（1.96 是标准正态分布在或处的分位数，其中 %)，在实践中使用，特别是当比例非常小或非常大时（这里经常出现这种情况）。 $p \pm 1.96 \times \sqrt{p(1-p)/n}$ $p=0.975$ $1-\alpha/2$ $\alpha=5$

如需进一步参考，您可以查看

纽科姆，RG。单一比例的双边置信区间：七种方法的比较。 医学统计，17, 857-872 (1998)。

请参见

Kosinski, Andrzej S. 用于比较诊断测试预测值的加权广义得分统计。医学统计http://dx.doi.org/10.1002/sim.5587 在线发表：2012 年 8 月 22 日

其它你可能感兴趣的问题

上一篇裂区方差分析：R 中的模型比较测试下一篇是否有调试 MCMC 程序的标准技术？