我的数据如下。我有两组患者。每组患者接受了不同类型的眼科手术。对每组患者测量了 5 个变量。我想使用置换检验或 MANOVA 比较两组之间的这些变量。进行手术的眼睛在分析中并不重要。但是,例如,A 组中的患者 2 对双眼进行了手术,因此对这 5 个变量进行了两次测量,每只眼测量一次。我可以将患者 2 左和患者 2 右视为两个不同的观察结果吗?B 组中的患者 31 相同。 $$ \begin{array} \hline \text{Patient} & \text{Surgery type} & \text{Side} & \text{V1}& \ldots & V5\\ 1 & \text{A} & \text{左} & 91 & \ldots & 22\\ 2 & \text{A} & \text{左} & 87 & \ldots & 19\\ 2 & \text{A} & \text{Right} & 90 & \ldots & 23\\ 。& . & . &\\ 31 & \text{B} & \text{左} & 90 & \ldots & 17\\ 31 & \text{B} & \text{右} & 88 & \ldots & 19\\ 32 & \文本{B} & \text{Right} & 91 & \ldots & 24\\ 。& . & . &\\ \hline \end{数组} $$
我可以在样本中使用“左眼”和“右眼”作为两个不同的主题吗?
我不会推荐它。不是领域专家,我仍然可以确定三件事会降低结果的独立性:
- 两只眼睛(几乎)同时接受治疗。虽然这不一定是一个问题,但它会影响其他独立性假设。更重要的是,手术团队可能会选择以相同的方式治疗两者,或者可能会考虑另一只眼睛的各个方面来决定一只眼睛。
- 两只眼睛都由同一个手术团队治疗(外科医生和其他所有相关人员)
- 两只眼睛都受到相同的患者“因素”的影响,即任何可能影响结果的患者内在因素,例如对其他治疗的依从性、整体健康状况等。
如果关于结果的任何事情都可以归因于手术团队或患者,那么就有问题了。
因为到目前为止所有的答案都是否定的(提倡使用少于完整的数据集或建议对两只眼睛的情况进行有限的使用),让我们看看可以做些什么。为此,我们需要一个概率模型。
考虑单个响应变量 $Y$(显然是 V1 到 V5 之一)。作为出发点,假设响应取决于几个因素,包括 (one of V1 through V5, apparently). As a point of departure, suppose the response depends on several factors, including
平均或“典型”响应 $\mu$。.
一个随机的患者特定因子$\varepsilon$,均值为零。, with zero mean.
也许是两只眼睛都参与的指标,$X_2$。.
手术类型因素 $X_s$,它应该是眼睛的一个属性,但在每个患者中似乎是恒定的(从而限制了我们识别该因素的能力)。, which ought to be an attribute of the
左右系统差异的一个因素,$X_e$。.
对于每只眼睛,该眼睛的预期反应随机变化$\delta$,均值为零且独立于患者因素$\varepsilon$。, with zero mean and independent of the patient factor .
这里暗示该实验是以某些标准方式设计的:即,患者是从特定人群中随机选择的;治疗左眼、右眼或两者的决定要么是随机的,要么可以假设独立于其他因素;等。对这些假设的改变将需要模型的伴随改变。
根据该模型,患者 $i$ 中眼睛 $j$ ($j \in {\text{right}, \text{left}}$) 的预期响应为 () within patient is
这看起来像是一个有些复杂的部分嵌套混合模型。拟合参数 $\mu$、$\beta_2$ 和 $\beta_s$ 可以通过最大似然(或者可能是广义最小二乘回归)来完成。, and can be done with maximum likelihood (or possibly generalized least squares regression).
我提供这纯粹是为了说明,以展示人们如何从有利可图的角度思考这个问题并找到一种最充分利用数据集的方法。我的一些假设可能不正确,应该修改;可能需要额外的交互;可能需要考虑如何最好地处理眼睛之间的潜在差异。(左右之间不太可能存在普遍差异,但可能存在与患者的优势眼有关的差异,例如。)
关键是似乎没有任何理由将分析限制在每位患者一只眼睛或使用临时分析方法。标准方法似乎是适用的,使用它的一种好方法是从对实验进行建模开始。
我同意其他人的观点,即同一患者的两只眼睛不是独立的。但是,我本身并不同意只使用一个样本。毕竟那是在丢掉珍贵的样品。
在有点类似的情况下(我的一些患者再次对同一个肿瘤进行了手术),我确实使用了他们的样本。
- 对于(迭代/重复交叉)验证,我确保拆分是按耐心完成的。
- 我无法说明有效(统计)样本量。对我来说,由于一些患者的样本更多,这无论如何都没有问题。每个样本我都有数百个光谱,它们既不重复(它们取自不同的地方)也不独立。所以我不会在这里丢失任何东西。
- 我有时使用患者数量作为有效(统计)样本量的保守界限:至少患者是独立的
- 您可以称量样品,以便每位患者以相同的体重进入分析。
我同意@iterator。如果大部分人的双眼都做了手术,我会做一些配对的。如果只有一小部分人对双眼进行了手术,我可能不会为这些人使用任何一只眼睛,但肯定不会同时使用。