小 n:非参数或参数测试?

机器算法验证 样本量 李克特 样本 非参数
2022-03-16 10:29:26

我的情况是,我有的样本,并且所有变量的数据都不是正态分布的(根据 Kolmogorov-Smirnov 检验的结果)。在问卷中使用李克特量表收集数据。所以现在我不确定我是否可以使用参数测试或是否需要使用非参数测试。n=19

我发现书籍说如果你有一个小的,你应该总是使用非参数测试。但是,我还发现引用说明参数和非参数测试之间的选择取决于您的数据水平(李克特可以被视为名义上的),所以我应该使用参数测试。n

2个回答

在问卷中使用李克特量表收集数据。

从您决定使用李克特量表的那一刻起,就决定了数据是否实际上来自正态分布的问题(是否定的)。测试(并回答错误的可能性)一个您已经确定答案的问题是没有意义的(足够大的样本总是会导致通过合适的测试拒绝,但您可以告诉它是在没有数据的情况下全部)。您的数据不是来自正态分布;这已经是确定的了。

[然而,这也不是一个有用的问题;一个更好的问题不是“来自正态分布的数据吗?” (他们曾经吗?)但是“它对我的推论有多大影响?”,假设检验没有回答的问题。]

所以现在我不确定我是否可以使用参数测试

这取决于参数测试。参数并不一定意味着“正常”;你也许可以做出一些其他的分布假设,这些假设与你的情况足够一致,你会满足于你所拥有的任何偏离假设的影响。

或者我是否需要使用非参数测试。

当心 - 非参数测试也有假设,在某些情况下可能对它们有些敏感。

例如,许多非参数检验假设数据是连续的,如果您不考虑高度离散性,您可能会得到与名义性质完全不同的检验。有些假设对称。此外,特定测试的适用性可能取决于您感兴趣的精确假设 - 您可能需要一些额外的假设(或者可能需要一些不同的非参数程序)来测试您的实际假设。

我发现书籍说如果你有一个小的 n,你应该总是使用非参数测试。

对于非常小,这不一定是有用的建议,因为您可能没有可用的有用的显着性水平。在较大(但仍然很小)处,如果合适的非参数过程的假设成立,有时避免做出您的推断可能敏感的参数假设是有意义的(尽管有时可能会选择不同的、不太敏感的程序)。nn

但是我也找到了引用

哪些引用?他们实际上说了什么?

说明参数检验和非参数检验之间的选择取决于您的数据水平(李克特可以看作是名义上的)

不会。作为李克特量表一部分的单个项目至少是序数。如果您通过添加许多此类问题来构建李克特量表,那么您已经假设它是区间- 通过假设像'5'+'2' = '4'+'3'(如果你'能够添加分数并将每个“7”视为相同),每个组件项目都必须是间隔。如果它们是区间,它们的总和肯定是。

所以我应该使用参数测试。

我看不出“使用参数测试”是如何产生的。


你很少谈论你有什么样的假设(你想找出什么?);在这种情况下可以说得更多。

样本量在这里不是问题。您只能将非参数程序(取决于特定问题 Wilcoxon 检验、秩相关、Kruskal-Wallis 检验或其他)与 Likert 量表数据一起使用,因为它们是有序量表。

参数程序使用不同级别之间的间距。但在李克特量表上,这种间隔并不提供信息:您可以用“1,2,3,4,5”编码五个级别,或者您可以在不改变信息的情况下用“1,10,20,34,100”或“ 10、杰克、王后、国王、王牌”。因此,包含此任意信息的参数测试不会产生可重复的结果(在后一种情况下根本没有)。

然而,有时,样本量是决定参数检验和非参数检验的标准。也就是说,如果您不确定一个或另一个参数检验的假设是否成立,但您的样本量很大,您可以交叉手指,通过中心极限定理,平均值近似正态分布。对于小样本量,这种近似值不太好(例如,如果您的数据呈指数分布,则需要非常大的样本量才能使 t 检验可用),因此您只能依赖非参数检验。这样,您将牺牲有关观察之间间隔的信息并仅保留它们的等级。但这比自由的参数测试要好,因为您无意中选择了错误的假设。