检验统计量的理想特征是什么?

机器算法验证 假设检验
2022-03-24 07:25:25

我已经看到了以非常具体的方式组合多个术语的统计定义。这些表达式有什么优点,为什么不对数据使用任何计算?例如,您为什么要使用特定的形式,例如 t-test、F-test、Jarque-Bera,...?

它是否必须独立于某些数据属性?一些统计数据更强大吗?

3个回答

要使检验统计量成为统计检验,如果原假设为真,您需要知道该统计量的抽样分布。对于某些统计数据,更容易(渐近地)推导出该分布是什么,并且这些统计数据已命名为 t-statistic、F-statistic 等。存在许多不同的检验统计量,因为许多检验统计量只是检验不同的零假设. 有时差异很大,有时差异非常微妙。有时不同的检验统计量检验完全相同的假设。在这些情况下,差异可能是统计能力,有时结果证明是在不同的统计子学科中开发的相同测试并赋予不同的名称。

tl; dr:您的测试需要具有统计功效,统计功效的概念使原假设检验的整个存在理由无效

假设您在实验室中进行了一项实验,并且您想测试一种效果。诅咒!难道你不知道你只能拒绝没有效果吗?你没读过波普尔吗?难道你不知道试图证实任何事情都是不科学的,你只能试图反驳一些事情

你说得很好,所以你构想了一个零假设,你围绕它构建了一个统计数据,然后你测试了在零假设下你得到这样一个极值的可能性有多大。然而,你发现这个过程很乏味,你想知道你是否可以把它自动化一点。

然后你有一个绝妙的主意。要拒绝零假设,您将编写一份关于您的实验的报告(包含数据)。然后,您将通过加密散列函数(如 sha2)将该报告放入。由于这个哈希是非常不可预测的,如果没有影响,前 6 位将只有大约 1/128 的时间为 0。

因此,您现在有了一个通用的零假设检验。散列你的论文,并测试前 6 位是否为 0。如果不是,那么你可以在 p=0.78% 时拒绝原假设。这表明可能存在一种影响,您一直在研究的粘液霉菌正在以某种方式反转散列函数。

当然,在现实中,你有大约 0.78% 的机会拒绝零假设,而你所有的拒绝都是侥幸。据说你的测试没有力量

那么好吧,让我们使用有能力的测试!那么我们该怎么做呢?好吧,我们需要知道如果有影响会发生什么,让我们看看……恐怖!绝望!看来我们必须实际模拟我们的实际假设……但是……那是无法形容的不科学。休谟证明归纳是不可能的!

这是肮脏的秘密。零假设检验的整个概念是一种扭曲,用来保持我们没有对我们所追求的效果做出假设的假装,我们只是在拒绝假设。废话。从我们开始关心测试的力量的那一刻起,效果就被隐含地建模了。

从更多介绍统计的角度来看,一些测试对某些数据有用,而另一些则没有。例如,如果您的数据是正态分布的(或者如果您正在查看大于 30 的样本均值),则可以使用 Z 检验。它们很容易计算。

如果您被迫使用小样本,则更好的分布是 T 分布,它考虑了样本量。但是一旦样本量变得足够大,T 分布开始看起来像 Z(正态曲线)。

您可以构建一个 95% CI,然后计算 T 并发现它们一致:均值在置信区间内——T 不足以拒绝。不仅仅是toeMAYtoe toeMAHtoe,尤其是在介绍统计级别,这完全取决于您拥有的数据量、数据的分布以及您的要求。