我有一个关于如何设置数据集进行建模的问题。
假设我有一个数据集,表示一个人将根据某些特征购买哪辆车:
因变量是个别汽车(汽车 1、汽车 2、……汽车 100)。
自变量是:
预算(买方)
最喜欢的颜色(买家)
……
……
颜色(1号车)
颜色(2号车)
……
颜色(汽车 100)
MPG(1号车)
MPG(2号车)
……
MPG(汽车 100)
假设这是一个多类分类问题。因此,在每种情况下只能选择一辆车。
我的问题是:拥有这样的自变量是否合适 - 特定于每个因变量?(汽车 X 的颜色,汽车 X 的 MPG,……)。将这样的一行放入模型中是否合适?模型如何知道每种颜色都在讨论相同的特征?颜色
最后,这种类型的数据/问题有名称吗?我不确定如何在 Google 上查找它。