比较不同变量的总体成员的排名顺序

机器算法验证 排名
2022-03-20 00:00:48

我有一些数据描述了有学习障碍的人的住宅单元,诸如家具有多漂亮、单元上的精神症状水平、工作人员有多开心等变量。

我想看看我们是否在衡量正确的事情——例如,员工更快乐的单位是否有更好的氛围,家具漂亮的单位是否有快乐的员工,诸如此类。

问题是我只有 8 个单位的数据(每个单位的平均值,例如 10 名员工对他们的幸福程度做出回应,这是该单位的平均值)所以我不能真正使用线性回归来查看事情是否我们所测量的相互影响。我已经为所有数据绘制了一些散点图,总的来说,我会说确实存在我所期望的线性关系。但正如我所说的 8 个单位,它并不会真正产生任何统计数据。

我有一个绝妙的想法,即对所有变量中的每个单元进行排序,然后以某种方式比较排名顺序。如果我们测量的是正确的东西,那么排名应该是相似的,就像这样:

Unit 1 (ranks across all variables): 1,1,1,1,1,1,1,1,1
Unit 2: 2,2,2,2,2,2,2,2,2

等等

而如果我错了,并且变量彼此不重要,我会得到这个:

Unit 1: 1,2,3,4,5,6,7,8
Unit 2: 8,7,6,5,4,3,2,1
Unit 3: 4,5,6,7,8,1,2,3

等等

这是我得到的:

Unit1    7    5  5.0    5    3    4    5    3
Unit2    6    2  4.0    6    5    3    2    5
Unit3    3    7  7.5    1    4    1    1    1
Unit4    4    4  3.0    7    6    7    7    8
Unit5    5    3  1.0    4    2    5    6    7
Unit6    2    6  6.0    8    8    8    8    6
Unit7    1    8  7.5    3    7    6    4    4
Unit8    8    1  2.0    2    1    2    3    2

它对我来说看起来很不错,除了第一列。

对此有什么想法吗?是我没听说过的正确统计吗?或者我可以用这些结果做一些合理的事情吗?

抱歉问了这么长的问题,提前非常感谢!

1个回答

我不知道以下方法有多大用处,但人们对这种情况的概念可能略有不同:想象不同的变量是简单地将单位从“最佳”到“最差”排序的评估者。您希望“评分者”之间的排名顺序相似。这似乎是评估者间在 R 中W

> rtr1    <- c(1, 6, 3, 2, 5, 4)  # rank order from "rater" 1
> rtr2    <- c(1, 5, 6, 2, 4, 3)  # "rater" 2
> rtr3    <- c(2, 3, 6, 5, 4, 1)  # "rater" 3
> ratings <- cbind(rtr1, rtr2, rtr3)
> library(irr)      # for kendall()
> kendall(ratings)
 Kendall's coefficient of concordance W
 Subjects = 6 
   Raters = 3 
        W = 0.568 

 Chisq(5) = 8.52 
  p-value = 0.130

编辑:这相当于相关样本的弗里德曼测试:

> rtrAll <- c(rtr1, rtr2, rtr3)
> nBl    <- 3    # number of blocks / raters
> P      <- 6    # number of dependent samples / units
> IV     <- factor(rep(1:P, nBl))         # factor sample / unit
> blocks <- factor(rep(1:nBl, each=P))    # factor blocks / raters
> friedman.test(rtrAll, IV, blocks)
        Friedman rank sum test
data:  rtrAll, IV and blocks 
Friedman chi-squared = 8.5238, df = 5, p-value = 0.1296