我的数据集中有以下属性。姓名、出生日期、年收入、已缴税款、性别。每个变量的类型是什么,即分类或连续?为什么?
PS。我相信分类属性是具有固定值集的属性。如果我对这个假设有误,请告诉我。“名称”属性也只是一个标签。但它属于什么类别?
我的数据集中有以下属性。姓名、出生日期、年收入、已缴税款、性别。每个变量的类型是什么,即分类或连续?为什么?
PS。我相信分类属性是具有固定值集的属性。如果我对这个假设有误,请告诉我。“名称”属性也只是一个标签。但它属于什么类别?
名称属性不能是连续的,如果你真的要使用它那就把它当作一个分类。这取决于您的用例是什么。性别是分类的。出生日期/年收入/纳税日期通常是连续变量。但是您可以根据您的用例对它们进行分类更改。
连续数据和离散数据是数字变量的类型,从某种意义上说,人们可以对它们进行数学运算(例如身高、体重、收入等)。另一方面,分类数据类型属于某个类别,但不具有数学性质(即,对此类变量的数学运算意义不大)。在您的示例中,所支付的收入和税款是数字,它们是连续的,但姓名、性别和出生日期是分类的。