我目前正在写我的硕士论文,我正在分析从数字高程模型 (DEM) 获得的属性。我尝试比较两个点集,我从两个具有不同分辨率的 DEM 栅格中提取了高度值。
长话短说:我对两个属性(非正态分布和配对样本)进行了 Wilcoxon 符号秩检验。现在,箱线图看起来非常相似,平均值显示出大约一米的差异。我已经了解到显着性对大 n 高度敏感,因此,我专注于效果大小。由于相似的箱线图和平均值,我预计效果会很小。然而,由于这种转变确实是片面的,所以效果大小 () 变得相当大,尽管这两组实际上非常相似。
我知道,这些测试旨在找到最小的差异,并实现了这一目标,因为存在单向转变。尽管存在差异,但它相当小,我正在寻找考虑到这一点的效果大小。换句话说,它不仅应该按样本量进行归一化,还应该按属性范围进行归一化。
是否有考虑属性范围的效应大小度量?
下面是一些用模拟数据说明这种行为的 R 代码:
# install.packages("coin")
library(coin)
set.seed(1)
a <- runif(1000,900,1100)
b <- a+runif(1000,0,1)
wilcoxsign_test(a ~ b)
-27.393/sqrt(length(a)) # Z-score/sqrt(n)
diff <- c(a - b)
diff <- diff[ diff!=0 ]
diff.rank <- rank(abs(diff))
diff.rank.sign <- diff.rank * sign(diff)
W <- sum(diff.rank.sign)
Z <- W/sqrt((1000*1001*2001)/6)
Z/sqrt(1000)
windows()
d = stack(list(a=a, b=b))
boxplot(values~ind, d)
windows()
boxplot(a-b)