数值离散有限数据是否也可以始终被视为分类数据?

数据挖掘 数据挖掘 统计数据 数据
2022-02-03 11:56:07

例如,在许多来源中,数据被分类为定性(分类)和定量(数值)。其中数值数据可以是连续的或离散的,而离散的可以是有限的或无限的。

我想确定数字、离散和有限数据是否也可以被视为分类数据。

我知道这取决于数据的“含义”并且需要一些常识分析,但我想确定以下陈述是否始终正确:

“数值、离散和有限数据可以是分类数据”

在数据的分类中,数字数据被认为具有“作为衡量某物的数学意义”。但是“技术上”,在不评估数据含义的情况下,如果我们将其从数学含义中剥离出来,它也确实使它们能够成为分类数据(无论是否有序)。

示例可以是以下项目数组:

活力

15
15
20
25
25

每个观察都具有“能量”特征,它可以被视为数学离散和有限的数值,可以衡量一个项目的能量。但也可以将其视为一个类别:两个项目在 15 类别中,一个在类别 20 中,两个在类别 25 中。

感谢您确认这一点。

1个回答

在这种情况下,我会将表示分开。

正如您提到的,在现实世界中,能量具有非常连续的价值。但是,我们可能会选择(出于各种原因)以不同的形式表示该值。

我们可以按原样取值 (15.21252, 23.76535),我们可以将它们四舍五入为整数 (15, 24),我们甚至可以决定用簇来表示这些数据(“UNDER 20”、“OVER 20”)。

从技术上讲,所有数据都可以表示为分类数据,我们需要考虑这些数据代表什么价值,以及我们从使用不同的表示中失去/获得什么。