机器算法验证 - Gamma 分布的概率区间 - 吾爱随笔录

机器算法验证 r 分布自习置信区间伽马分布

2022-03-29 14:16:08

在下面的练习中我做错了一些事情，我希望能得到一些帮助来解决这个问题。

令分布的随机样本。定义。 $X_1, X_2, \ldots, X_5$ $\Gamma \left(3,3 \right)$ $W=\sum_{i=1}^5 X_i$

由于是 iid 伽玛变量的总和，现在一个简单的变换参数表明。这样就完成了问题 1。 $W$ $W \sim \Gamma \left(15,3 \right)$ $Y=\frac{2}{3} W \sim \chi^2 \left(30 \right)$

现在对于问题 2，我的想法是使用问题 1 的结果来转换这些概率，即。因此，除非我在这里犯了一个可怕的错误： $\frac{2}{3} W \sim \chi^2 \left(30 \right)$

P (\frac{2}{3} c_{1} < Y < \frac{2}{3} c_{2}) = 0.95

$P \left( \frac{2}{3} c_1 < Y < \frac{2}{3} c_2 \right)=0.95$

个自由度的常数。就我而言，下限为。 $30$ $16.791$ $46.979$

那么如果我们等于并求解我们应该能够找到上述伽马置信区间的常数，对吧？ $\frac{2}{3}c_1=16.791$ $c_1$

问题是根据，，而不是所需的，这意味着我在某个地方出错了。我不认为这是有问题的因为我已经多次验证了结果。 $R$ $P \left( W<c_1 \right) =1$ $0.025$ $1$

谢谢你。

1个回答

你的代数听起来一切都很好。

您没有提供足够的信息来猜测您如何决定“根据，，而不是所需的 $\text{R}$ $P(W<c_1)=1$ $0.025$ ”。

这是伽马分布的一个常见问题——有两种不同的常见参数化，两者都相当普遍，如果我们不小心，我们可能会认为我们正在处理一个，而实际上我们正在处理另一个。（实际上，在处理伽马 GLM 时会经常出现第三种参数化，即形状均值参数化，但当它出现时，它通常会更明显。）

维基百科（今天版本的永久链接）提供了这两种形式，请参见右侧的列。令人困惑的是，它交换了我认为更传统的参数名称的角色（在我看来，更常见的是比例，更常见的是速率）。 $\beta$ $\theta$

[虽然在处理软件时会出现很多问题，但这不仅仅是一个软件问题，因为这个问题也经常发生在人与人之间。]

碰巧的是，R 是这类问题的罪魁祸首，它对收集 gamma 分布函数的帮助似乎已经使水变得浑浊（我在撰写本文时使用的是 3.0.2，但是问题已经存在很久了）。

我的猜测是您可能会pgamma使用未命名的参数调用 R 中的函数，但提供形状和比例参数，就像这样......

 pgamma(16.791*3/2,15,3)
[1] 1

...当 R 默认为 shape 和 rate 参数时。

如有疑问，请绘制。这是您要计算的内容：

伽马形状=15，比例=3

如您所见，（大约 25）左侧的比例看起来大致正确。 $\frac{3}{2}16.791$

这是我怀疑您正在计算的实际密度：

plot(x,dgamma(x,15,3),col=3,type="l")

伽马形状=15，速率=3

这里左边的比例将非常接近 1。 $\frac{3}{2}16.791$

不幸的是，R 的帮助不太清楚——甚至是积极的误导。“描述”下的句子暗示提供的参数是形状和比例 - 并且rate“参数”下的描述证实了印象（！） - 但函数本身的参数列表不是模棱两可的，如果不是很明显对新手用户：

pgamma(q, shape, rate = 1, scale = 1/rate, lower.tail = TRUE, log.p = FALSE)

您是否看到scale为指定的任何功能的默认值rate？如果只在之后提供两个未命名的参数q，它们是形状和速率，然后通过取倒数获得比例。

也就是说，您需要使用命名参数来获取您想要的内容：

 pgamma(16.791*3/2,15,scale=3)
[1] 0.02500255

当有任何潜在的疑问时，无论如何你都应该命名你的论点，以使它们对人类读者明确。

其它你可能感兴趣的问题