如何比较排名数据?

机器算法验证 序数数据 排行 群体差异
2022-04-10 14:43:26

我对如何分析排名数据有一些疑问。

数据如下所示:要求居住在同一村庄的 4 组 HIV 感染者和 16 组其他人被要求根据重要性对 HIV 感染者面临的 12 项挑战进行排名。(fe 身体健康 - 社会接受度 - 心理健康 - ...) 我如何知道 HIV 感染者对某个挑战的看法是否与其他人不同?

另一个问题:所有受访者 (120) 都被要求从挑战列表中单独选择对自己最具挑战性的 5 个。我如何知道 HIV 感染者是否选择了与其他人不同的挑战?

展示研究结果的最佳方式是什么?是否有任何统计测试?克鲁斯卡尔瓦利斯是可能的吗?我一直在寻找整个互联网,但我被卡住了..

3个回答

对于您的第二个任务,您可以考虑排序方法,以便您在多元“挑战空间”中绘制个人的位置。艾滋病毒感染者和非艾滋病毒感染者的不同集群似乎支持你的假设。

对于您的第一个问题,将您的选择转换为每组的数字数据(按顺序),然​​后取每组中每个人的每个选择之间的绝对差。差异最大的可能被认为是每个群体认为最不同的那些。

假设您有两个人,每个人分别属于 A 组和 B 组。每个人有 12 个项目的等级,1-12。对于第 1 项:A 选择 1,B 选择 7。如果其余项目不变或非常接近于零,则 A 组和 B 组认为第 1 项不同,因为该项目具有最大的差异。

您还需要判断这是否有意义。也许想出一个你确定的等级子集,每个组都会有不同的想法,做不同的事情,看看它是否适合你的子集。

定义重要性得分为等级,取值 1 到 12,1 为最不重要,12 为最重要

选择一个感兴趣的因素,例如健康,然后从第 1 组和第 2 组收集重要性分数,例如:

score_health_1 <- c(1,2,3,2,4,1,2,4,3,1,2,2,3,1)

score_health_2 <- c(3,4,5,5,6,1,2,4,6,5,3,3,2,8,7,4)

然后您可以进行 wilcox.test(score_health_1, score_health_2) 或 t 检验。您可以分别对 12 个因素中的每一个执行此操作。

如果您对多元检验感兴趣,例如健康和社会,那么您可以使用 Hottelling t^2 检验,它解释了多元检验中的相关性。