我在很多地方读到过,我们永远不能说我们“接受”了原假设。相反,我们必须说我们“未能拒绝”原假设。
但是我看不出这与这个简单的例子有什么关系:假设我们正在测试一种应该在 24 小时内完全治愈糖尿病的药物。我们对 1000 名患者进行了试验,所有患者在服药后仍然患有糖尿病。
这种药不能治愈糖尿病不是很明显吗?即,我们接受原假设?
我当然不会相信这种药物。
零假设:药物对患者没有影响。
替代假设:该药物可以治愈糖尿病
我在很多地方读到过,我们永远不能说我们“接受”了原假设。相反,我们必须说我们“未能拒绝”原假设。
但是我看不出这与这个简单的例子有什么关系:假设我们正在测试一种应该在 24 小时内完全治愈糖尿病的药物。我们对 1000 名患者进行了试验,所有患者在服药后仍然患有糖尿病。
这种药不能治愈糖尿病不是很明显吗?即,我们接受原假设?
我当然不会相信这种药物。
零假设:药物对患者没有影响。
替代假设:该药物可以治愈糖尿病
可能性一:药物作用很小。 也许它可以治愈 0.0001% 的服用者。您概述的测试仅意味着您提出的戏剧性替代方案没有足够的证据。
可能性二:药物有很强的负面作用。(归功于@ssdecontrol) 也许药物没有效果,所有这些患者都会自己好转,但由于药物,没有患者康复。
在没有任何先验知识的情况下,数据将与这些可能性以及空值为真的可能性一致。
因此,未能拒绝 null 并不意味着 null 比其他这些可能性更真实。
这里有一些很好的答案,但我认为关键问题没有在任何地方明确说明。 简而言之,您对零假设和替代假设的表述是无效的。 原假设和备择假设必须是互斥的(也就是说,它们不能同时为真)。您的配方符合该标准。然而,它们也必须是集体详尽的(也就是说,其中之一必须是真实的)。你的配方不符合这个标准。
你不能有一个零假设,即药物有的机会治愈糖尿病,而另一种假设是药物有的机会治愈糖尿病。想象一下药物治愈糖尿病的真实概率是,那么你的无效假设和替代假设都是错误的。那是你的问题。
原型零假设是一个点值(例如,实数线上的,但这只是惯例)。此外,如果您正在使用有界参数空间(就像您在这里一样 - 概率必须在范围内),尝试测试处于极限的值(即或 )通常会出现问题)。选择一个点值作为您的空值(您想要拒绝的值),您可以获得反对它的证据,但无法从您的数据中获得证据(参见@John 的有见地的答案)。为了进一步理解这一点,它可能会帮助您在此处阅读我的答案:为什么统计学家说一个不显着的结果意味着“你不能拒绝零”而不是接受零假设? 将这些想法更具体地应用于您的情况,即使您的 null 为(因此您的替代假设是患者身上尝试了这种药物,但没有一个人存在治愈,你不能接受你的零假设:数据仍然与概率为的可能性一致(请参阅:如果没有失败,如何判断失败的概率?)。
另一方面,您不必有一个空点。例如,单尾(即)空假设不是点。它们是无限点的集合。同样,您也可以有一个范围/区间假设(例如,参数在范围内)。在这种情况下,您可以根据证据接受您的 null — 这就是等效性测试的全部内容。(当然,你仍然可能犯 I 类错误。)
正如其他用户评论的那样,接受零假设的问题是我们没有足够的证据(我们也永远不会)得出结论,效果正好为 0。从数学上讲,假设检验通常无法回答此类问题.
但是,这并不意味着您的问题的意图不是有效的!事实上,这通常是仿制药临床试验的意图:目标不是表明您已经生产出更有效的药物,而是您的药物基本上与名牌产品一样有效(并且您可以生产它的成本要低得多)。等效性通常被认为是零假设。
为了使用假设检验来解决这个问题,该问题以可以回答的方式进行了改革。重新格式化的问题如下所示:
其中,是仿制药的效果,是名牌药物的效果。因此,现在如果我们拒绝零假设,我们可以得出结论,仿制药的有效性至少是名牌产品的 75%。显然,这与说完全等价不同,但它解决了您感兴趣的问题(并且我认为这是一个数学上更合理的问题)。
我们可以以类似的方式处理您的问题。与其试图说“我们有足够的证据来得出 0 效应吗?”,我们可以问“鉴于我们的证据,我们的结果不太不寻常的最大效应是什么?”。在和 0 次成功的情况下,可以声称我们有足够的证据得出结论,成功的概率小于 0.3%(基于 Fisher 的精确检验,)。
从这个结果中,您当然仍然可以得出结论,这不是您会相信的药物。
假设药物有效,但仅对 0.00001% 的人口有效。药物有效,期间。在统计上检测到它对 10000 人的样本起作用的几率是多少?10万人?1,000,000 人?