我目前正在寻找一个具有零假设的测试,即样本不是来自观察正态分布的随机变量。换句话说,我想知道是否有与 KS、Anderson-Darling、Shapiro-Wilk 或 Jarque-Bera 相反的测试。
对非正态性的零假设是否有任何检验?
我认为无论正态性是原假设还是替代假设,问题都是一样的。测试是拟合优度的度量。如果测试基于传统方法,那么您将寻找测试统计量应该有多大才能拒绝正态性。如果您将正态性作为替代方案,那么您是在问这个统计数据需要多小才能说分布足够接近正态。
我还没有看到这样做,但它非常类似于在制药行业中进行了很多的等效性测试。对于等效性测试,您希望证明您的药物与竞争对手药物的性能相似。这通常在尝试寻找已上市药物的通用替代品时进行。您定义了与 0 之间的一小段距离,称为等价窗口,并且当您对性能度量的真实均值差在等价窗口内有很高的置信度时,您会拒绝原假设。该方法在 Bill Blackwelder 的论文“证明零假设”中得到了很好的定义。测试统计数据相同或相似,只是执行方式不同。例如,不是使用双尾 t 检验来表明均值差不同于 0,而是 你做了两个单边 t 检验,你需要拒绝两者来声明等价。确定样本量,使得当实际均值差小于某个指定的小值时拒绝不等价的能力。
我认为可以以相同的方式提出拒绝非正态性的测试。
我认为问题没有很好地定义!您想证明数据“并非来自正态分布”。很简单,接受!没有数据“来自正态分布”,正态分布充其量只是一个近似值。
但是你当然可以对其他分布进行拟合优度检验,Poisson 说。我不知道是否有很多发布,但你可以做的是为选择的分布制作一个qq-plot。对于泊松情况,您可以做的是(R 代码):
dat <- rpois(200,10)
p <- qpois(ppoints(200), 10)
qqplot(p,dat)
并且测试统计量可能是 qqplot 中的相关性: cor(p,sort(dat))
现在您可以通过模拟找到该统计量的零分布:
cors <- vector(mode="numeric", length=1000)
for (i in 1:1000) {
cors[i] <- cor(qpois(ppoints(200), 10), sort(rpois(200, 10))
}
hist(cors)
在实践中,您可能会估计泊松均值,因此您必须重新进行包含均值估计的模拟。您可能还希望将模拟样本的数量从 1000 个增加到 1000 个!
包含平均值估计的模拟可以是:
NSIM <- 1000
SAMPSIZE <- 200
MEAN <- 10
cors <- vector(mode="numeric", length=NSIM)
for (i in 1:NSIM) {
samp <- rpois(SAMPSIZE, MEAN)
m <- mean(samp)
cors[i] <- cor(qpois(ppoints(SAMPSIZE), m), sort(samp))
}
hist(cors)
答案是正态分布的卡方拟合优度检验
在这里您可以看到示例http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm