您正在询问“合理结论”的概率。当且仅当您对合理结论给出足够精确的定义时,您才能得到这个。我也希望有一个程序能够可靠地告诉我偏离正态性的重要性何时足够重要,但是从样本量 1 和 2(任何样本都完全符合正态分布)到任意大样本量——微小的偏差将返回低于常规阈值的显着性水平。
重要的事情取决于你的目的和你对数据的看法,因为统计数据是一种利用个人专业知识和经验的工艺,就像它是一种编码技术一样。例如:
边际正态分布很少需要,甚至是理想的。
在实践中,如果我发现非常接近条件正态分布的近似值——例如,在已知对高质量数据而言科学合理的模型的残差中——我会更频繁地怀疑欺诈,而不是隐含地相信结果。
教初学者如何轻松地进行显着性测试是相当困难的,尤其是在坚持高估它的学科中,而且因为在你开始独立了解什么有帮助之前,你必须查看许多数据集。但是初学者可以成长为专家的存在证明是有专家的事实。
编辑通用“测试”是发布数据的正常分位数图以及来自正常大小的随机样本的几个正常分位数图。方便的模拟样本数量可能是 24、35、48,...,当与原始样本结合时,可以显示 5 x 5、6 x 6、7 x 7...显示。这是排队测试,类似于应将嫌疑人与各种任意的人一起展示给证人的想法。如果无法从其他人中识别出嫌疑人,则不支持不同的情况。虽然最近经常重新发明,但这个想法在沃尔特休哈特的主要著作中(并且可能更早)。该测试的一个吸引力是安娜卡列尼娜原则,即每个非正态分布都可能以其不同的方式成为非正态分布。