与值列表相比,一个值有多重要?在大多数情况下,统计测试涉及将样本集与总体进行比较。在我的例子中,样本是由一个值组成的,我们将它与总体进行比较。
我是统计假设检验的业余爱好者,面临着可能是最基本的问题。这不仅仅是一项测试,而是数百项测试。我有一个参数空间,并且必须对每个点进行显着性检验。为每个参数组合生成值和背景列表(总体)。然后我按 p 值排序并找到有趣的参数组合。事实上,找到这个 p-val 高(不显着)的参数组合也很重要。
因此,让我们进行一次测试:我有一个从选定集生成的计算值和一个通过选择随机训练集计算的背景值集。计算值为 0.35,背景集(可能?)正态分布,平均值为 0.25,标准值非常窄(e-7)。我实际上对分布一无所知,因为样本是从其他东西计算出来的,它们不是来自某个分布的随机数样本,所以背景是正确的词。
零假设是“样本测试的平均值等于我的计算值,即 0.35”。我什么时候应该将其视为 Z 检验或 T 检验?我希望该值显着高于总体平均值,因此它是一个单尾检验。
我对将什么视为样本感到有些困惑:我要么有一个样本(观察),而背景列表作为总体,要么我的样本是背景列表,我将其与整体(未抽样)进行比较根据原假设应该具有相同均值的总体。一旦决定了这一点,我猜测试就会走向不同的方向。
如果是 T 检验,我如何计算它的 p 值?我想自己计算它而不是使用 R/Python/Excel 函数(我已经知道如何做到这一点),因此我必须首先建立正确的公式。
首先,我怀疑 T 检验有点过于笼统,因为在我的情况下,T 检验将与样本量相关联并且具有以下形式:
- 如何计算 p 值?(即不使用 R/Python/Excel 函数或 p 值表查找,而是根据公式实际计算它,因为我想知道我在做什么)
- 如何根据样本量确定显着性阈值?(一个公式会很好)