维基百科给出了以下定义:
右删失:一个数据点高于某个值,但未知多少。
左删失:数据点低于某个值,但未知多少。
在这些定义中,含义是:
- “数据点”
- “一定的价值”,和
- “多少”
一般来说,什么是左右审查?
以下陈述是否属实:
“在右审查中,我们只有审查值的下限。”
左翼审查的类似说法是什么?
维基百科给出了以下定义:
右删失:一个数据点高于某个值,但未知多少。
左删失:数据点低于某个值,但未知多少。
在这些定义中,含义是:
一般来说,什么是左右审查?
以下陈述是否属实:
“在右审查中,我们只有审查值的下限。”
左翼审查的类似说法是什么?
由于使用了生存标签,我将添加一个答案,提供一些具有生存分析风格的示例。
数据点
对于一个数据点,我们只是指一些观察,即一个或多个变量的结果。例如,我们可能在数据集中有以下内容:我们研究中的人 1 是男性,死于 58 岁。我们可以将其视为一个数据点。但是在您的示例中,很明显数据点仅包含一个变量的结果,例如 58。
右审查
如果我们对失败时间进行建模,则有一个明显的审查理由,即我们不一定有时间等待所有科目都失败。假设我们正在测试儿童疫苗的效果。如果我们进行一项随机试验,我们的最后一个受试者将在一百年或更长时间后死亡。这自然会引入审查,在这种情况下是右审查,就像我们在某些时候不得不说“我们不知道这个人还能活多久,我们只知道她还活着”。如果随机试验中的人失访,也可能发生右删失,例如他们可能想停止参与研究或离开。这些是右审查的例子,基本上我们' 对我们的受试者的寿命感兴趣,但由于实际情况,我们只审查了观察结果,这意味着对于某些受试者我们永远不会知道他们什么时候死,只知道在某个时间点(审查时间)他们还活着。因此,我们知道对于被审查的个人,数据点(死亡时间)大于某个值(审查时间)。
左审查
作为左删失的示例,请考虑以下内容。假设一些狒狒部队总是睡在树上。我们想估计他们在早上什么时候从树上下来,让我们假设他们每天都从树上下来。我们跟随他们几天,但是,我们喜欢睡在里面,这意味着有几天他们甚至在我们到达现场之前就已经下降了。天上午 9 点到达并且狒狒已经下降,我们有左删失数据。我们想知道他们什么时候下降,但我们只有一个上限(上午 9 点),因为我们知道在我们到达时他们已经下降了。类似地,我们现在知道数据点(第天的下降时间)小于某个值(上午 9 点)。
这个例子取自
Andersen, PK, Borgan, Ø., Gill, RD 和 Keiding, N. (1993),基于计数过程的统计模型,Springer Series in Statistics,Springer-Verlag,纽约。
这本书提供了审查的数学定义,可能不是人们应该得到的第一本关于生存分析的书。但是,它也有一些直观的例子,如上。
假设我拥有一家酒吧,那里有乐队演奏。酒吧很小,所以任何时候只有 150 人可以观看一场演出(这是关键)。我出售演出门票,所以我的会计数据如下所示:
date band price tickets_sold
10/01/14 Texas Instruments $20 2
10/02/14 Unkind Donuts $30 150
...
03/02/15 The Capybaras $15 120
数据点只是该表中的一行。
假设我要考虑的变量是对门票的需求。首场演出的需求没有受到审查。只有两个人想以 20美元的价格观看德州仪器,而 148 票未售出。我确切地知道20美元的需求:售出的 2 张门票。
然而,由于节目售罄,需求变量在第二行被删减。我知道至少有 150 人想以每张票 30 美元的价格看 Unkind Donuts ,但我不知道有多少人没有票就被拒之门外,所以我不知道确切的需求量。我只知道150的下限。
现在假设我想衡量第三场演出的出席率。我们可以计算门口的人数,但为了这个例子,让我们假设我的保镖不擅长算术。我们知道有些人会买票然后不来。这意味着出席人数最多为 120,因为这是售出的门票数量。这是左审查的水豚出席人数 的上限。
左删失的一个常见误解是您不知道它开始的时间间隔数据点的分类。许多人认为这是左删失,但实际上是右删失,因为我们对区间长度有一个下限。
一个具体的例子可能是“foo-pox”持续时间的临床数据,通常是一种非终末期疾病,我们对人们恢复所需的时间长度感兴趣。foo-pox 的症状很容易观察到(例如:你的牙齿变绿了)。我们研究中的大多数人都确切地知道什么时候开始,什么时候结束。
此类研究中右删失数据的经典示例是在研究结束时仍然患有 foo-pox 或在研究期间消失(“失访”)时仍然患有 foo-pox 的受试者(假设我们知道这些人的疾病开始日期)。对于这些人,我们对持续时间有一个下限,因此他们的数据是正确审查的。这在直觉上是“右删失”,因为我们不知道时间段的右手端。
问题是当我们不知道时间段的开始日期时(独居且没有镜子的人,所以不知道他们的牙齿何时变绿)。这些是左审查还是右审查?许多人错误地认为时间段的左端是未知的,因此被删减了。这是术语的不幸结果,我猜这是在没有这种审查的情况下发展起来的。对于这些人,我们对时间段有一个下限(我们知道他们至少从他们的邻居提到他们的绿牙直到他们好转或研究结束并且他们仍然生病)患有foo-pox,因此他们的数据是右删减。