如何选择原假设和备择假设?

机器算法验证 假设检验 自习
2022-02-25 18:51:26

我正在练习假设检验,但我发现自己在决定如何设置零假设和替代假设时遇到了麻烦。我的主要问题是在每种情况下确定一个“一般规则”,即我如何正确决定哪个是零假设,哪个是替代假设..有人可以帮助我吗?

下面是一个例子:作为一个成熟的学者,你被要求评估客户关系管理是否会影响公司的财务业绩。主要问题将通过假设检验来解决。将测试两个假设:CRM 与绩效相关,CRM 不相关。

谢谢。

3个回答

正确制定假设检验的规则是,替代假设或研究假设是这样的陈述,如果为真,则得到数据提供的证据的强烈支持。

假设通常是备择假设的补充通常,它是(或包含)您为计算检验统计量而对数据如何分布所做的假设。

以下是一些示例,可帮助您了解如何正确选择它们。

  1. 假设我是公共卫生领域的流行病学家,我正在调查某个种族的吸烟率是否高于整个人口,因此有必要针对这一亚群开展反吸烟运动通过更大的社区外展和教育。从之前发表在文献中的研究来看,我发现一般人群中的发病率是p0. 然后我可以开始收集样本数据(这实际上是困难的部分!)来测试

    H0:p=p0vs.Ha:p>p0.
    这是一个单边二项式比例检验。 Ha是这样的陈述,如果它是真的,需要我们收集的数据强烈支持。它是承担举证责任的陈述。这是因为我们从测试中得出的任何结论都以假设 null 为真为条件:要么Ha被接受,或者测试没有结论,并且数据中没有足够的证据表明Ha是真的。的选择H0反映了一个基本假设,即亚人群的吸烟率与整体相比没有差异。

  2. 现在假设我是一名研究人员,正在研究一种我认为与现有治疗标准同样有效的新药,但副作用更少,因此安全性更佳。我想通过进行生物等效性测试来证明同样的功效。如果μ0是现有标准治疗效果的平均值,那么我的假设可能如下所示:

    H0:|μμ0|Δvs.Ha:|μμ0|<Δ,
    对于一些保证金选择Δ我认为有临床意义的。例如,临床医生可能会说如果两种治疗方法的生物等效性小于Δ=10%治疗效果的差异。再次注意Ha是承担举证责任的陈述:我们收集的数据必须强烈支持它,以便我们接受它;否则,它仍然可能是真的,但我们没有证据支持这种说法

  3. 现在假设我正在为销售三种产品的小企业主进行分析A,B,C. 他们怀疑这三种产品在统计上具有显着的偏好。那么我的假设是

    H0:μA=μB=μCvs.Ha:ij such that μiμj.
    真的,这一切Ha意思是有两种方式彼此不相等,这表明存在一些偏好差异。

零假设几乎总是“没有发生”或“没有影响”或“没有关系”或类似的东西。但不一定是这样。

在您的情况下,空值将是“CRM 与绩效之间没有关系”

通常的方法是在某个显着性水平(最常见的是 0.05)测试空值。这是否是一个方法是另一回事,但这是通常的做法。

在科学证明中,你永远无法证明任何事情,你只能证明你的模型比另一个模型更好地描述了数据。您希望备用假设来自被测新模型,而原假设来自不同的模型。

零假设应该来自其他人在挑战您的科学主张时会选择使用的模型! 科学主张最常见的模式是“我认为 X 是过程 Y 中的一个因素。 如果每个人都已经相信 X 是过程中的一个因素,那么没有什么可证明的,每个人都可以出去谈论它零假设的科学论证很有趣,因为如果有人持相反的观点,“X 不是过程 Y 中的一个因素,那么就会有分歧。这就是科学发挥作用的地方。

如果您相信“X 是过程 Y 中的一个因素”足以进行实验,那么您通常应该知道您希望在结果中看到什么。所以现在你的短语变成了“X 是过程 Y 中的一个因素,产生可见的结果 Z。”

这是您选择零假设的地方。如果有人认为 X 不是一个因素,而您的实验确实显示了 Z,那么他们需要对 Z 进行解释。 通过您选择零假设,您实际上是在挑战他们的解释最简单的解释总是“Z 是由随机机会引起的,因为科学是基于统计的”。因此,大多数零假设的形式是“应使用先前接受的模型加上一些随机机会来解释统计数据来预测结果。

这两个假设都应该用可见的结果来表述,而不是你打算证明的模型。[注意] 你永远不会从“我相信 X 是一个因素”的替代假设开始。您将其表述为“当我观察 Z 时,我希望看到这个结果。” 零假设的措辞类似,“现状预测,当我观察 Z 时,我们将看到这种不同的结果。” 那里总是有一个统计短语,例如“当我一遍又一遍地做这个实验时,我希望在 Z 上观察到正态分布。” 一旦您观察到为您的替代假设辩护并拒绝零假设的结果,您就可以对您的模型的有效性提出主张。

[注意] 这个粗体声明是我的意见,但我对它的措辞选择有足够的信心来发布它。这些假设在科学的直观部分与科学的数据和分析之间划清了界限。如果您的措辞与模型过于接近,则很难将模型与数据分开,并使下一位科学家更难使用您的数据

在我们具有过程 Y 和可见结果 Z 的简单模型的情况下,现有的信念是 Z 将适合每个人都已经习惯的分布,例如“您的特定实验室设备设置所期望的随机性”或“实验中使用的试剂。” 当你“拒绝零假设”时,你所说的最字面意思是,“我已经进行了这个实验,随机机会产生观察到的行为的可能性极小,每个人都应该开始考虑,也许这不仅仅是满足眼。”

备择假设是你向世界提供的替代原假设的东西做实验去戳别人模型的漏洞是一回事,但这并不能像在别人的模型中戳漏洞然后用做得更好的新模型替换它们那样促进科学。

概括

使用零假设和备择假设,您正试图挑战当前的传统思维。选择假设,以便他们有效地声明“这是每个人都期望的结果(零假设)。但是,我实际上出去做了实验并收集了数据,零假设不太可能是真的。这是我预期的结果(替代假设)。除了我之外,没有人期望这个假设是正确的,但是当我收集数据并进行统计时,很可能我的模型比现有模型更好地描述了现实。因此,我拒绝零假设,接受我的假设,并挑战我的科学家同事们利用这些新数据开展工作。”

科学家们可以自由地:

  • 欣喜若狂,张开双臂接受您的数据和模型。
  • 忽略您的数据或模型(对不起,它发生了......欢迎来到现实生活)
  • 拒绝您的数据,并努力进行实验以显示不同的数据(科学界经常会说“我们不相信您的样本量为 10。我们将以 1000 的样本量重做您的实验。 )
  • 接受您的数据,但不要接受您的模型。然后,他们必须努力生成一个新模型,以不同的方式解释数据。

最后的结果会引起冲突和争吵,但绝对是科学过程的一部分。通过使用科学方法发布您的结果,您接受其他人可以自由地使用科学方法来反驳您的结果。他们会这样做,并公布他们的结果。

此时,科学界将做出政治决定:谁必须出去花钱测试他们的模型,我们接受谁的模型。通常,因为您首先发布了模型和数据,而他们正在反驳您的数据,所以他们有责任进行实验,以证明为什么他们的模型比您的模型更好。但这现在远远超出了最初引起冲突的假设,所以我让你在有生之年体验它们!