学生t统计量是否有非假设检验用途?
t 统计量是否有与假设检验无关的用途?
当您询问“ t-统计量”时,我会想到具体数量
要实际计算这个数量,我们必须指定. 这通常是参考一些给定的零假设来选择的。所以对我来说,试图将“统计”与它所隐含联系的零假设分开似乎很尴尬. 环境例如,您在输入t.test(rnorm(10))$statisticR 时隐含地执行的操作为 0,与假设检验隐含相关.
我认为学生 t 分布有用的地方是作为拟合数据的参数形式。归根结底,这只是另一个对称的钟形分布。它只是比高斯有更肥的尾巴。因此,它可用于对您希望保留对称性和钟形形状的事物进行建模,但为极端结果提供比高斯函数更多的概率质量。我知道它在金融中被用于模拟资产回报(例如链接 1、链接 2),但我不能说这些模型有多成功或有用,因为我自己不使用它们。
我怀疑它们对于有一些指向肥尾的先验知识的分层建模者特别有用。Gelman 在贝叶斯数据分析的第 17.2 节中简要讨论了在肥尾情况下使用 t 而不是高斯。
最严格意义上的“假设检验”总是导致拒绝或未能拒绝零假设的二元结果。T 统计量通常转换为 p 值,然后将其与某个预定义的阈值进行比较以做出二元确定。然而,可以使用 t 统计量本身作为“偏离原值”的一般度量,而不必采取最后一步来检验是否应该拒绝原假设。以这种方式使用 t 统计量仍然来自假设检验框架,但实际上并不会导致是否应该拒绝零值的检验,所以我认为这不是严格的“假设检验”。
例如,t 统计量可以用作按显着性对特征进行排序的一种方法,同时考虑差异的方向性。例如,基因集富集分析搜索一组一致上调或下调的基因,因此差异的方向性对于这种方法很重要。按 p 值对特征进行排名不会区分上调和下调基因,而只是将最重要的基因放在列表的顶部。另一方面,根据 t 统计量进行排序,会将最显着的上调基因放在列表的一端,将最显着的下调基因放在另一端。尽管 t 统计量的大小与 p 值直接相关,但在计算假设检验的 p 值时会丢失 t 统计量的符号。