间隔/比率的区别是否重要?

机器算法验证 测量
2022-04-05 06:14:19

统计方法根据变量的测量水平而有所不同,如果将变量分类为名义型、有序型或区间/比率,它可能会有所不同。但我从未见过任何取决于间隔/比率区别的统计测试。

暂且不谈对测量水平的“标准”分类的任何哲学反对意见,是否有任何统计理由来关心区间和比率测量水平之间的差异?

2个回答

计算百分比或比率似乎是对比率尺度有效但对区间尺度无效的最简单的统计操作。

摄氏或华氏温度是间隔刻度测量的示例(没有固定的 0)。例如,说 110°C 比 100°C 高 10% 是没有意义的,因为如果将温度转换为华氏温度,您会得到230212212×100%=8%更热。

然而,长度有一个固定的 0,并且是一个比率比例。所以现在,你可以说 110 厘米的物体比 100 厘米的物体长 10%。如果将其转换为英寸,您仍然会得到(43.307139.3701)39.3701×100%=10%

例如,考虑各种广义线性模型——例如,伽马、泊松或逆高斯回归模型。这些模型(加上其他一些模型)对应于可归类为比率数据的数据模型(零是有意义的,2 确实是 1 的两倍,等等)。

此外,这些模型并不等同于在数据中添加或减去常量(因此它显然不是简单的区间)。

如果您尝试分析某些类型的时间/计数/货币数据 - 以及许多其他类型的数据,那么此类模型可能非常有用。


以一种相关的方式,对数变换或幂变换通常对于具有任意零的数据(其中数据意味着完全相同的事物但不同的零)通常没有意义,即使数据恰好是全正的。它通常对比率数据有意义。

还应该注意不要太沉迷于斯蒂芬斯的类型学。还有其他类型对统计目的更有用;实际上,使用类型学来决定分析(而不是使用数据来调查或回答的问题)的概念可能经常被放错地方。有时它可能会有所帮助,但并不罕见,恰恰相反。