如何计算连续诊断测试在预测连续结果(例如,血压)时的敏感性和特异性(或类似测量)而不将结果二分法?有任何想法吗?
似乎研究人员已经使用混合效应建模(见下面的链接)完成了这项工作,但我不熟悉他们对该技术的使用: http ://www.ncbi.nlm.nih.gov/pmc/articles/PMC3026390/
顺便说一句,我对 R 最为熟悉,因此对于您建议的带有 R 函数的实现来说,这将是理想的(但如果没有也可以)。
提前感谢您的任何建议!
如何计算连续诊断测试在预测连续结果(例如,血压)时的敏感性和特异性(或类似测量)而不将结果二分法?有任何想法吗?
似乎研究人员已经使用混合效应建模(见下面的链接)完成了这项工作,但我不熟悉他们对该技术的使用: http ://www.ncbi.nlm.nih.gov/pmc/articles/PMC3026390/
顺便说一句,我对 R 最为熟悉,因此对于您建议的带有 R 函数的实现来说,这将是理想的(但如果没有也可以)。
提前感谢您的任何建议!
即使在二元情况下(即通常从 Y 预测 X),尝试使用连续变量来执行此操作也会暴露出反向时间顺序测量的严重问题。
由于问题仍未得到解答,这是我的 2ct:
我认为这里有两个不同的主题混合到这个问题中:
如何计算连续诊断测试在预测连续结果(例如,血压)时的敏感性和特异性(或类似测量)而不将结果二分法?
我认为您想衡量模型的性能。该模型预测来自某种输入的连续(度量)结果(在您的示例中也可能是度量,但这在这里并不重要)。这是一个回归场景,而不是分类。所以你最好寻找回归模型的性能指标,敏感性和特异性不是你要找的*。
一些回归问题具有“自然”分组为某物的存在和不存在,这提供了与分类的链接。为此,您可能有一个双峰分布:大量不存在的案例,以及存在案例的值的度量分布。例如,想一想污染某些产品的物质。许多产品样品不会含有污染物,但对于那些含有污染物的样品,会观察到一定范围的浓度。
但是,对于您的血压示例,情况并非如此(此处没有血压不是一个明智的概念)。我什至猜想血压呈单峰分布。所有这些都指向一个与分类没有密切联系的回归问题。
*需要注意的是,这两个词都在分析化学中用于回归(校准),但含义不同:在那里,灵敏度是校准/回归函数的斜率,而特定有时意味着该方法是完全选择性的,即是否对分析物以外的其他物质不敏感,不发生交叉敏感性。
AD McNaught 和 A. Wilkinson 编辑:化学术语纲要(“金书”)。布莱克威尔科学,1997。国际标准书号:0-9678550-9-8。DOI:doi:10.1351/金本。网址:http://goldbook.iupac.org/。
连续结果的敏感性和特异性类似物
另一方面,如果问题的本质是分类,您可能仍然会发现自己通过回归更好地描述它:
对于这些情况,将敏感性和特异性背后的概念扩展到“连续结果分类器”是有意义的。基本思想是根据每个案例属于相关类别的程度对其进行加权。对于参考标签的敏感性和特异性,对于预测的类成员的预测值。事实证明,这导致与回归类型的性能测量非常密切的联系。
我们最近在
C. Beleites、R. Salzer 和 V. Sergo 中对此进行了描述:使用部分类成员身份验证软分类模型:适用于星形细胞瘤组织
Chemom
分级的敏感性和 Co. 的扩展概念。
英特尔。实验室。Syst., 122 (2013), 12 - 22.
该链接指向 R 包的主页,用于实施建议的性能测量。
同样,恕我直言,血压示例没有被充分描述为分类问题。但是,您可能仍想阅读这篇论文——我认为那里的参考值的制定将清楚地表明,血压并没有以适合分类的方式进行明智的描述。
(如果您制定一个连续程度的“高血压”,这本身就是一个模型,并且与您描述的问题不同。)
我只是快速浏览了您链接的论文,但如果我理解正确,作者对两种建模策略都使用阈值(二分法):对于连续预测进行进一步处理:计算预测间隔并与某个阈值进行比较。最后,他们有一个二分法的预测,并通过改变区间的规范来生成 ROC。
当您指定要避免这种情况时,该论文似乎并不过分相关。
松散地说,敏感性是指在某事物存在时对其作出反应的能力,而特异性是指在它不存在时抑制反应的能力。对于连续变量,灵敏度对应于所获得的测量值对被测量变量的真实值的回归斜率,特异性对应于测量的标准误差(即被测量时所获得的测量值的标准偏差不变)。
编辑,回应 Frank Harrell 和 cbeleites 的评论。我试图给出敏感性和特异性的概念类似物。对于连续变量,灵敏度的基本思想是,如果两个对象(或同一对象在不同时间或不同条件下等)在我们试图测量的变量上不同,那么我们获得的测量值也应该不同,更大的真实差异导致更大的测量差异。
任何变量的回归,比如说, 在任何其他方面, 说, 只是条件期望值,, 被视为一个函数. 的敏感性到是该函数的斜率 - 即,它相对于-- 以任何值评估感兴趣,并且可能使用反映不同事件的相对重要性或发生频率的权重进行平均-价值观。
特异性的基本思想是敏感性的反面:如果具有高特异性,并且没有真正的差异然后我们所有的测量-values 应该是相同的,无论变量对象之间可能存在什么差异;不应回应这些差异。什么时候是恒定的,较高的可变性之间-values 意味着较低的特异性。条件标准差——即 sd,再次被视为一个函数- 是特异性的反向测量。条件斜率与条件 sd 之比是信噪比,其平方在心理测量学中称为信息函数。