我有一个观察向量, MyData它是一个 >= 0 和 <= 1 的百分位数。
我想测试MyData向量的正态性。首先,我用和绘制了MyData向量与正态分布的关系。在 RI 中进行正态分布以与以下内容进行比较:mean= mean(mydata)sd = sd(mydata)
rnorm(rnorm(length(mydata), mean(mydata), sd(mydata))
在下面,您会看到直方图,并且MyData在 0.8 到 1 的存储桶中,中间的观察次数较多,而观察次数较多。
所以数据看起来不正常,当我运行 Jarque-Bera 和 Shapiro-Wilk 测试时,我得到了
雅克-贝拉 p 值 = .0007
夏皮罗-威尔克 p 值 = .000000006
所以这些测试也支持数据的非正态性:
我的问题是:是否真的可以测试 >= 0 和 <= 1 之间的分布是否正常?因为从下面的直方图中可以看出,正态分布进入了MyData没有的范围。请注意,直方图具有低于 0 和高于 1 的黄色 bin,它们超出了MyData(>= 0 和 <=1) 的可能值。
那么:在这种情况下测试正常性的正确方法是什么,或者我是否在正确的轨道上得出数据不正常的结论?

