我使用一些连续变量和一些分类变量进行glm了多元逻辑回归。R只有连续变量的 p 值 < 0.05 和不跨越 1 的置信区间。
运行 Wilcoxon 检验(实际上是 Mann-Whitney 检验,因为样本未配对)并将分为两个结果组返回 p 值为 0.15。这表明两组中 A 的均值没有差异
如何协调这两个结果?逻辑回归结果表明是结果的预测因子,但 Wilcoxon/Mann-Whitney 表明两组之间没有差异。
我使用一些连续变量和一些分类变量进行glm了多元逻辑回归。R只有连续变量的 p 值 < 0.05 和不跨越 1 的置信区间。
运行 Wilcoxon 检验(实际上是 Mann-Whitney 检验,因为样本未配对)并将分为两个结果组返回 p 值为 0.15。这表明两组中 A 的均值没有差异
如何协调这两个结果?逻辑回归结果表明是结果的预测因子,但 Wilcoxon/Mann-Whitney 表明两组之间没有差异。
您是否只适合一个大 glm 模型然后查看各个 p 值?
请记住,这些 p 值衡量的是该变量对模型中所有其他变量的影响。您的更多协变量可能确实有贡献,但存在冗余信息,因此它们没有显示意义。可能是 A 与另一个协变量或 2 的组合显示了真正的差异,但 A 本身没有意义。
还要查看所有术语的效果大小和标准误差。与 Wald 检验/估计(标准摘要中的各个 p 值)相关的一个悖论是,您可以让一个非常重要的变量看起来不显着,因为标准误差被高估了。因此,似然比测试要好得多。
您可以通过仅使用 A 拟合简化模型来评估上述两种情况,然后使用 anova 函数比较这两个模型,如果这很重要,则表明您的模型中除了 A 变量之外还有一些重要的东西。
测试做出不同的假设,因此不会给出完全相同的结果。更大的问题是(不正确的)假设,即未能拒绝空值“表明没有区别”。它不是。这只是意味着您没有足够的证据来拒绝没有区别的零。
更合适的比较器是比例优势模型,其中包含 Wilcoxon 检验作为特例。请注意,“多变量”是指同时分析多个因变量。我认为您的意思是说“多变量”。
如果我理解正确,您正在测试与结果的平均值是否与与结果相关的预测变量 A 的平均值不同。即使它们没有区别,这个结果对你的研究问题也没有任何意义。它所说的只是在您的样本中,预测变量的平均值在因变量的成功和失败之间是不同的。我将举一个例子,以便您了解原因。
想象一下,我很想知道教育是否会影响员工在给定公司担任经理的可能性。我随机收集员工样本,其中名员工不是经理,名员工实际上是经理。我进行了逻辑回归,教育的效果很显着(关于 p 值的通常警告也适用于此)。
现在,您可能想知道样本是否平衡,即经理和非经理的教育是否存在相同的差异。看到这一点的第一个测试是测试他们的手段是否不同。如果他们的手段没有差异,那么您就会知道,平均而言,在您的样本中,经理和非经理的教育水平相同。您可以检查经理和非经理之间的教育水平是否存在大致相同的差异。但我认为很明显,Wilcoxon 检验(或 Mann-Whitney)与您的预测对成功概率的影响没有任何关系(在我的例子中,成功意味着成为一名经理)。