排除测量值低于检测限的观测值?

机器算法验证 回归 审查 化学计量学
2022-03-22 19:03:27

我正在分析暴露变量x和反应之间关系的数据集y(在我的例子中,这些是特定化合物的尿浓度和认知功能的测量)。x使用具有较低检测限的分析方法测量 - 大约 12% 的人群的浓度低于检测限。

在第一次分析中,我比较了y高于和低于检测限的参与者,发现了显着差异——这并不奇怪。

我的问题是:当我对 - 进行回归分析时,我y ~ x应该排除所有这些x < detection limit吗?它确实会影响结果并且实际上会反转关联(如果我包括所有观察,则关联是积极的 - 如果我排除它们,它是消极的)。

2个回答

OP 在定量(回归)上下文中询问低于“检测限”的值。

然而,检测限是一种方法性能特征,它指的是定性而不是定量的任务。这就是为什么我最初的答案是指量化(量化)的下限。

参见例如Currie、Pure&Appl。Chem., 67, 10, 1699-1723, 1995 关于这些条款。

讨论结果表明,所讨论的限制实际上是校准范围的下限(结束)。即 OP 正在询问如何处理结果超出他们校准和验证其方法的范围的样本。这使我的原始答案有些偏离主题。


原答案:

不要仅仅因为它们低于 LLOQ 就将它们排除在外!(定量下限)

  • LLOQ不是一个神奇的硬阈值,低于该阈值就无话可说。标记分析的相对误差低于 10% 的浓度是一种惯例。
  • 请注意,LLOQ 通常是在假设家庭方差的情况下计算的,即绝对误差与浓度无关。也就是说,对于低于或高于 LLOQ 的情况,您甚至不会假设不同的绝对误差。从这个角度来看,LLOQ 本质上只是一种以浓度单位表示分析方法的绝对不确定性的方式。(例如以升/100 公里与英里/加仑为单位的燃油经济性)
  • 即使分析误差与浓度有关,真实浓度几乎相同但略低于和略高于 LLOQ 的两个案例具有几乎相同的不确定性。
  • (左)审查数据(这是排除低于 LLOQ 的案例的技术术语)会导致连续数据分析中的各种复杂情况(并且您需要使用可以处理此类数据的特定统计方法)。
  • 向您的临床实验室表示感谢,他们为您提供了完整的数据:我遇到过很多人遇到相反的困难:得到的报告只是低于 LLOQ,而且不可能恢复任何进一步的信息。

底线:永远不要审查您的数据,除非您有非常非常好的理由这样做。


替换下面的 LLOQ 结果并鉴于以下评论:LLOQ2

从下面的评论中,我认为我们使用术语的方式可能略有不同——可能是由于来自不同的领域:

  • 线性范围:作为浓度函数的信号的线性(可以放宽到严格单调)依赖性的浓度范围。
  • 校准范围:校准和验证样品所涵盖的浓度范围。在这个[准确地说:验证所涵盖的范围]之外,我们并不真正知道我们的方法的行为方式。
    => 我完全同意如果 1/8 的样本超出校准范围,并且这些样本对于在研究中得出正确的结论很重要,则需要做TM

  • LLOQ(又名LQLOQ)是一种方法性能特征。它们可以在校准范围之内或之外。我所知道的LLOQ的最基本定义是指定在定量范围内不得超过的相对误差。在我的领域中,它通常设置为 10%(但这可能会有所不同,实际上应该根据应用程序的要求而有所不同。所以对我来说 10% 的相对误差就像显着性测试的 5% 阈值,默认约定)p

我遇到了 LLOQ 浓度的各种替换常数,范围从 上的 0到 LLOQ 以及低于 LLOQ 的浓度范围内的随机值(是新的背后的想法是什么?)。这些通常是在没有(gu)估计可用的情况下为审查数据估算值的绝望尝试。LLOQ2LLOQ212

  • 使用上述 LLOQ 的定义可用于您的样品中遇到的整个浓度范围的验证数据,替换低于 LLOQ 的浓度将等于丢弃您对这些样品的大部分少量信息,而这通常不是您想要的。有关插图,请参阅我对这个相关问题的回答
    此外,这不会避免使用适用于审查数据的统计方法的必要性,因此排除确实没有太大区别。

  • 但是,在您的情况下,是否有可能将验证的浓度范围进一步扩大到低端?即使您没有相应地扩展校准范围(恕我直言,这是最好的)。
    您说排除或不排除这 12% 的样本对您的发现有很大影响。因此,这里的想法是通过为足够大的样本建立线性和分析误差来挽救研究,以获得更高水平的稳定估计(研究问题)。
    虽然不如从一开始就进行适当的校准,但意想不到的事情毕竟是研究中必须预料到的。结论中适当谨慎,恕我直言,这对于早期研究是可以接受的(与后期阶段相比,后期阶段可以更好地了解预期浓度范围或努力将其确立为分析/临床方法)。

  • 在某些情况下,您的校准功能低浓度平台开始,然后在线性范围内达到合适的灵敏度(例如,特定绝对量的分析物由于吸附而被掩盖/丢失,...)。与校准/验证范围之外但仍处于线性范围内的低浓度相比,您基本上不能说该高原中的浓度。
    我认为这是“湿实验室/化学审查”。在这种情况下 => 对审查数据使用统计方法。
    这里更高层次的问题是您的分析方法是否适合目的。

假设您有一个 X 的测量误差,其标准偏差为 100。如果 X 测量为 1000,那么预期值(假设一个校准良好的测量系统)约为 1000。但假设测量的量是 110。它是可能实际值为310;可能是平均值的两个标准偏差。但是假设 X 不能为负数,那么实际值不可能比测量值低两个标准差。因此,可能存在轻微偏差,假设测量值为 110,X 的真实值的预期值略大于 110。随着您的测量值越来越小,这种偏差会越来越大。

这种情况是否发生以及发生的程度取决于很多因素,例如实际值的分布情况以及测量误差的作用方式。但最重要的是,包括低于 LLOQ 的测量值很可能会损害回归的有效性。不幸的是,删除它们并不能消除问题,反而会使问题变得更糟。您需要查看如何对错误进行建模,对实际分布做出了哪些假设,以及有哪些方法可以补偿。删除它们会颠倒关系当然是一个危险信号,在处理它们时需要小心。