R中dt和pt函数的等价性

机器算法验证 可能性 t检验 t分布
2022-04-04 07:12:20

出于我自己的好奇心,我决定质疑 R 中 dt 和 pt 的等价性。

pt 表示 t 分布的累积密度函数。所以这给了我们因此,如果我想找到的概率,我需要做到目前为止,一切都很好。如果您正在计算 t 检验的 p 值,则可以这样做。P(Xx)P(X>x)1P(Xx)

但是假设我想使用正则概率函数 dt。我相信这计算了发生的概率(因为在连续分布中)。我希望是相同的。P(X>x)P(X=x)=0pt1dt

然而在 RI 中得到 -

> 1-dt(3, df=10)
[1] 0.9885995
> pt(3, df=10)
[1] 0.9933282

它们接近但不相等。尽管它们离得太远了,但我认为这是我的逻辑中的某种错误,而不是它们的数值解决方案中的某种错误。

任何人都可以填补这里的空白吗?谢谢!

1个回答

我相信这计算了 P(X>x) 发生的概率(因为 P(X=x)=0 在连续分布中)。我希望 pt 和 1−dt 是相同的。

你的信念(以及因此你持有的期望)是错误的。

in的是密度你认为密度不是概率是对的。R 中的函数(在等连续分布上完成时)不返回概率,它们返回密度函数在其第一个参数值处的高度。ddtd...t

https://en.wikipedia.org/wiki/Probability_density_function

如果您查看t-distribution上的 wikipedia 页面,右侧的上图显示了密度——dt几个不同自由度返回的东西。下图显示了分布函数(cdf),这是pt(至少默认情况下)返回的东西。如果你想要上尾,你可以通过将参数更改为pt. 这在 t 函数的帮助中进行了解释?dt

pt(x,df)返回 左边的密度下的面积x

在此处输入图像描述