机器算法验证 - 是否应该使用自由度校正来推断 GLM 参数？ - 吾爱随笔录

是否应该使用自由度校正来推断 GLM 参数？

机器算法验证回归广义线性模型推理近似 t分布

2022-03-14 10:18:29

这个问题的灵感来自 Martijn在此处的回答。

假设我们为一个参数族（如二项式或泊松模型）拟合 GLM，并且它是一个完全似然过程（而不是说，quasipoisson）。然后，方差是均值的函数。使用二项式： $\text{var}[X] = E[X]E[1-X]$ 和泊松 $\text{var}[X] = E[X]$ .

与残差正态分布时的线性回归不同，这些系数的有限、精确抽样分布是未知的，它可能是结果和协变量的复杂组合。此外，使用 GLM 对mean的估计，用作结果方差的插件估计。

然而，与线性回归一样，系数具有渐近正态分布，因此在有限样本推断中，我们可以用正态曲线近似它们的采样分布。

我的问题是：通过对有限样本中系数的抽样分布使用 T 分布近似，我们有什么收获吗？一方面，我们知道方差但我们不知道确切的分布，因此当引导或折刀估计器可以正确解释这些差异时，T 近似似乎是错误的选择。另一方面，也许 T 分布的轻微保守主义在实践中只是首选。

1个回答

简短回答：还没有完整的答案，但您可能对与链接问题相关的以下分布感兴趣：它比较 z-test（glm 也使用）和 t-test

    layout(matrix(1:2,1,byrow=TRUE))

    # trying all 100 possible outcomes if the true value is p=0.7
    px <- dbinom(0:100,100,0.7)
    p_model = rep(0,101)
    p_model2 = rep(0,101)
    for (i in 0:100) {
      xi = c(rep(1,i),rep(0,100-i))
      model = glm(xi ~ 1, offset=rep(qlogis(0.7),100), family="binomial")
      p_model[i+1] = 1-summary(model)$coefficients[4]
      model2 <- glm(xi ~ 1, family = "binomial")
      coef <- summary(model2)$coefficients
      p_model2[i+1] = 1-2*pt(-abs((qlogis(0.7)-coef[1])/coef[2]),99,ncp=0)
    }


    # plotting cumulative distribution of outcomes z-test
    outcomes <- p_model[order(p_model)]
    cdf <- cumsum(px[order(p_model)])
    plot(1-outcomes,1-cdf, 
         ylab="cumulative probability", 
         xlab= "calculated glm p-value",
         xlim=c(10^-4,1),ylim=c(10^-4,1),col=2,cex=0.5,log="xy")
    lines(c(0.00001,1),c(0.00001,1))
    for (i in 1:100) {
      lines(1-c(outcomes[i],outcomes[i+1]),1-c(cdf[i+1],cdf[i+1]),col=2)
    #  lines(1-c(outcomes[i],outcomes[i]),1-c(cdf[i],cdf[i+1]),col=2)
    }

    title("probability for rejection with z-test \n as function of set alpha level")


    # plotting cumulative distribution of outcomes t-test
    outcomes <- p_model2[order(p_model2)]
    cdf <- cumsum(px[order(p_model2)])
    plot(1-outcomes,1-cdf, 
         ylab="cumulative probability", 
         xlab= "calculated glm p-value",
         xlim=c(10^-4,1),ylim=c(10^-4,1),col=2,cex=0.5,log="xy")
    lines(c(0.00001,1),c(0.00001,1))
    for (i in 1:100) {
      lines(1-c(outcomes[i],outcomes[i+1]),1-c(cdf[i+1],cdf[i+1]),col=2)
      #  lines(1-c(outcomes[i],outcomes[i]),1-c(cdf[i],cdf[i+1]),col=2)
    }

    title("probability for rejection with t-test \n as function of set alpha level")
    [![p-test vs t-test][1]][1]

而且只有很小的区别。而且 z 检验实际上更好（但这可能是因为 t 检验和 z 检验都是“错误的”，并且 z 检验的误差可能补偿了这个误差）。

长答案： ...

其它你可能感兴趣的问题

上一篇为什么基于稀疏数据的协方差矩阵的 eigen 和 svd 分解会产生不同的结果？下一篇MLE 和 Baum Welch 在 HMM 拟合上的区别