机器算法验证 - 在R中解释泊松输出 - 吾爱随笔录

机器算法验证 r 泊松分布

2022-03-28 09:11:53

我在解释 R 中完成的泊松对数线性模型的结果时遇到了一些问题。我会给出我的想法，如果有人愿意扩展它，那就太好了。我只需要帮助解释系数。

我在网上看到了一些解释，但几乎所有的使用都使用主效果或只使用一种效果来解释。此外，堆栈交换的答案并不是外行人可以理解的那么简单。先感谢您。

数据来自题为“澳大利亚医疗保健和健康保险需求的微观计量模型”的论文

这是带有间隔的反向转换数据。

我做了一些初步的推论，

我们可以由此推断，医生对零岁女性的预期就诊次数为 0.23（截距），CI 为 0.195 和 0.271。

每多一名男性，医生的预期就诊次数增加 0.45，CI 为 0.349 和 0.576。

随着年龄增加一个单位，CI 为 1.006 和 1.012 的女性的医生就诊次数增加 1.009。

同样，随着年龄增加一个单位，如果患者是男性，医生的就诊次数增加 1.012，CI 为 1.007 和 1.017。

它是否正确？

1个回答

由于是泊松模型，因变量的期望值与自变量通过对数链接的逆相关，也就是说

$E(y) = \exp(\beta_0 + \beta_1 x_1 + \beta_2 x_2 + \beta_3 x_1 x_2)$

其中，x1 = 0 如果女性，1 如果男性，x2 = 年龄，并且 $\beta_0$ 到 $\beta_3$ 是按 R 输出中显示的顺序估计的系数。

当你有一个零岁的女性时，这里的三个自变量都等于零。因此，零岁女性的预期访问次数为 $\exp(-1.466168) = 0.23$ 这就是拦截的意义。如果你取它的指数，你会得到基线访问次数，其中基线意味着所有自变量都设置为零。

零岁男性的预期访问次数为 $\exp(-1.466168 - 0.801987) = 0.10$ 或者 $\exp(-.801987) = 0.45$ 乘以零岁女性的预期访问次数。

随着年龄的增长，女性的预期访问次数会增加 1 倍 $\exp(0.009322) = 1.009$ 或约 1%。

随着年龄的增长，男性的预期访问次数会增加 1 倍 $\exp(0.009322 + 0.012186) = 1.022$ 或约 2%。

因此，总体而言，与女性相比，您预计新生儿男性的就诊次数约为女性的一半，但预期的就诊次数会随着年龄的增长而增加，大约是女性的两倍。

AIC 孤立地没有帮助。您可以将其与某些替代模型的 AIC 进行比较。粗略地说，在调整参数数量后，具有较低 AIC 的模型具有更好的拟合度。

您可以使用偏差进行拟合优度检验；基本上，无论任何无法解释的变化是否是由于您对泊松分布所期望的那种随机变化造成的。

泊松模型的参数一般没有封闭形式的解；它们必须使用数值方法计算。Fisher 评分迭代告诉优化器必须经过多少次迭代才能将偏差（我认为）最小化到某个可接受的容差范围内。如果迭代次数真的很高，您可能只会担心这一点，这可能指向指定不当的模型（无论如何，您可能会从异常大的参数值和/或标准错误中发现）。

其它你可能感兴趣的问题