反向转换置信区间

机器算法验证 置信区间 数据转换 反向转换
2022-03-22 22:37:53

遇到这个讨论后,我提出了关于反向转换置信区间约定的问题。

根据这篇文章,对数正态随机变量平均值的名义覆盖率反向转换 CI 是:

 UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n1))  LCL(X)=exp(Y+var(Y)2zvar(Y)n+var(Y)22(n1))

/ 而不是天真的 /exp((Y)+zvar(Y))

现在,以下转换的 CI 是什么:

  1. xx1/3
  2. arcsin(x)
  3. log(x1x)
  4. 1/x

随机变量本身的容差区间如何(我的意思是从总体中随机抽取的单个样本值)?反向转换的间隔是否存在相同的问题,或者它们是否具有名义覆盖率?

1个回答

你为什么要进行反向转换?这对于回答您的问题至关重要,因为在某些情况下,天真的变换是正确的答案。事实上,我想我会争辩说,如果天真的反向变换不是正确的答案,那么你根本不应该进行反向变换。

我发现反向转换的一般问题非常有问题,并且经常充满混乱的思维。看看你引用的文章,是什么让他们认为反向转换的 CI 没有捕捉到原始均值是一个合理的问题?这是对反向转换值的错误解释。他们认为覆盖范围应该用于在反向转换空间中进行直接分析。然后他们创建了一个反向变换来修复这个错误,而不是他们的解释。

如果您对日志值进行分析,那么您的估计和推论适用于这些日志值。只要您考虑任何反向变换来表示该日志分析在指数空间中的外观,并且仅如此,那么您就可以使用幼稚的方法。事实上,它是准确的。任何变换都是如此。

做他们正在做的事情解决了试图使 CI 变成它不是的东西的问题,即转换值的 CI。这充满了问题。考虑您现在所处的绑定,两个可能的 CI,一个在您进行分析的转换空间中,一个反向转换,对可能的 mu 在另一个空间中的位置做出非常不同的陈述。推荐的反向变换产生的问题多于它解决的问题。

从那篇论文中得到的最好的一点是,当您决定转换数据时,它对您的估计和推断的含义的影响比预期的要深。