t 分布密度函数背后的直觉

机器算法验证 可能性 正态分布 t分布
2022-03-12 18:35:37

我正在研究学生的 t 分布,我开始想知道,如何推导出 t 分布密度函数(来自维基百科,http ://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

在哪里v是自由度和Γ是伽马函数。这个函数的直觉是什么?我的意思是,如果我查看二项式分布的概率质量函数,这对我来说很有意义。但是 t 分布密度函数对我来说根本没有意义……乍一看根本不直观。或者只是直觉认为它有一个钟形曲线并且可以满足我们的需求?

感谢您的帮助:)

2个回答

如果你有一个标准的正态随机变量,Z, 和一个独立的卡方随机变量Qνdf,那么

T=Z/Q/ν

有一个t分布与νdf。(我不确定是什么Z/Q分布为,但不是t.)

实际推导是一个相当标准的结果。Alecos 在这里有几种方法

就直觉而言,我对具体的函数形式没有特别的直觉,但是通过考虑(按比例缩放)可以获得形状的一些一般意义ν) 分母上的独立 chi 分布是右偏:

在此处输入图像描述

该模式略低于 1(但随着 df 的增加而接近 1),有一些值可能大大高于和低于 1。Q/ν意味着方差t将大于Z. 的价值观Q/ν大大高于 1 将导致t- 接近于 0 的值Z是,而那些大大低于 1 将导致t- 远离 0 的值Z是。

这一切意味着t值将(i)更多变,(ii)相对更多的峰值和(iii)比正常值更重。随着 df 的增加,Q/ν集中在 1 附近,然后t会更接近正常。

在此处输入图像描述

(“相对更尖”会导致相对于散布稍微更尖的峰值,但较大的方差会将中心拉低,这意味着峰值略低,df 较低)

所以这就是为什么t看起来确实如此。

Glen 的答案是正确的,但从贝叶斯的角度来看,将 t 分布视为具有不同方差的正态分布的连续混合也是有帮助的。你可以在这里找到推导:

学生 t 作为高斯的混合

我觉得这种方法有助于您的直觉,因为它阐明了当您不知道人口的确切可变性时 t 分布是如何产生的。