我正在研究学生的 t 分布,我开始想知道,如何推导出 t 分布密度函数(来自维基百科,http ://en.wikipedia.org/wiki/Student%27s_t-distribution ):
在哪里是自由度和是伽马函数。这个函数的直觉是什么?我的意思是,如果我查看二项式分布的概率质量函数,这对我来说很有意义。但是 t 分布密度函数对我来说根本没有意义……乍一看根本不直观。或者只是直觉认为它有一个钟形曲线并且可以满足我们的需求?
感谢您的帮助:)
我正在研究学生的 t 分布,我开始想知道,如何推导出 t 分布密度函数(来自维基百科,http ://en.wikipedia.org/wiki/Student%27s_t-distribution ):
在哪里是自由度和是伽马函数。这个函数的直觉是什么?我的意思是,如果我查看二项式分布的概率质量函数,这对我来说很有意义。但是 t 分布密度函数对我来说根本没有意义……乍一看根本不直观。或者只是直觉认为它有一个钟形曲线并且可以满足我们的需求?
感谢您的帮助:)
如果你有一个标准的正态随机变量,, 和一个独立的卡方随机变量和df,那么
有一个分布与df。(我不确定是什么分布为,但不是.)
实际推导是一个相当标准的结果。Alecos 在这里有几种方法。
就直觉而言,我对具体的函数形式没有特别的直觉,但是通过考虑(按比例缩放)可以获得形状的一些一般意义) 分母上的独立 chi 分布是右偏:
该模式略低于 1(但随着 df 的增加而接近 1),有一些值可能大大高于和低于 1。意味着方差将大于. 的价值观大大高于 1 将导致- 接近于 0 的值是,而那些大大低于 1 将导致- 远离 0 的值是。
这一切意味着值将(i)更多变,(ii)相对更多的峰值和(iii)比正常值更重。随着 df 的增加,集中在 1 附近,然后会更接近正常。
(“相对更尖”会导致相对于散布稍微更尖的峰值,但较大的方差会将中心拉低,这意味着峰值略低,df 较低)
所以这就是为什么看起来确实如此。
Glen 的答案是正确的,但从贝叶斯的角度来看,将 t 分布视为具有不同方差的正态分布的连续混合也是有帮助的。你可以在这里找到推导:
我觉得这种方法有助于您的直觉,因为它阐明了当您不知道人口的确切可变性时 t 分布是如何产生的。