机器算法验证 - t 分布密度函数背后的直觉 - 吾爱随笔录

t 分布密度函数背后的直觉

机器算法验证可能性正态分布 t分布

2022-03-12 18:35:37

我正在研究学生的 t 分布，我开始想知道，如何推导出 t 分布密度函数（来自维基百科，http ://en.wikipedia.org/wiki/Student%27s_t-distribution ）：

f (t) = \frac{Γ (\frac{v + 1}{2})}{\sqrt{v π} Γ (\frac{v}{2})} {(1 + \frac{t^{2}}{v})}^{- \frac{v + 1}{2}}

$f(t) = \frac{\Gamma(\frac{v+1}{2})}{\sqrt{v\pi}\:\Gamma(\frac{v}{2})}\left(1+\frac{t^2}{v} \right)^{-\frac{v+1}{2}}$

在哪里 $v$ 是自由度和 $\Gamma$ 是伽马函数。这个函数的直觉是什么？我的意思是，如果我查看二项式分布的概率质量函数，这对我来说很有意义。但是 t 分布密度函数对我来说根本没有意义……乍一看根本不直观。或者只是直觉认为它有一个钟形曲线并且可以满足我们的需求？

感谢您的帮助:)

2个回答

如果你有一个标准的正态随机变量， $Z$ , 和一个独立的卡方随机变量 $Q$ 和 $\nu$ df，那么

$T = Z/\sqrt{Q/\nu}$

有一个 $t$ 分布与 $\nu$ df。（我不确定是什么 $Z/Q$ 分布为，但不是 $t$ .)

实际推导是一个相当标准的结果。Alecos 在这里有几种方法。

就直觉而言，我对具体的函数形式没有特别的直觉，但是通过考虑（按比例缩放）可以获得形状的一些一般意义 $\sqrt \nu$ ) 分母上的独立 chi 分布是右偏：

在此处输入图像描述

该模式略低于 1（但随着 df 的增加而接近 1），有一些值可能大大高于和低于 1。 $\sqrt{Q/\nu}$ 意味着方差 $t$ 将大于 $Z$ . 的价值观 $\sqrt{Q/\nu}$ 大大高于 1 将导致 $t$ - 接近于 0 的值 $Z$ 是，而那些大大低于 1 将导致 $t$ - 远离 0 的值 $Z$ 是。

这一切意味着 $t$ 值将（i）更多变，（ii）相对更多的峰值和（iii）比正常值更重。随着 df 的增加， $\sqrt{Q/\nu}$ 集中在 1 附近，然后 $t$ 会更接近正常。

在此处输入图像描述

（“相对更尖”会导致相对于散布稍微更尖的峰值，但较大的方差会将中心拉低，这意味着峰值略低，df 较低）

所以这就是为什么 $t$ 看起来确实如此。

Glen 的答案是正确的，但从贝叶斯的角度来看，将 t 分布视为具有不同方差的正态分布的连续混合也是有帮助的。你可以在这里找到推导：

学生 t 作为高斯的混合

我觉得这种方法有助于您的直觉，因为它阐明了当您不知道人口的确切可变性时 t 分布是如何产生的。

其它你可能感兴趣的问题

上一篇实际与拟合图告诉我们什么？下一篇如何为非线性最小二乘拟合选择初始值