我有一个带有目标变量的以下玩具数据集示例repair_type
id | car | mileage | repair_type | sex | age
1 | Honda | 12000 | engine | 1 | 50
1 | Honda | 12000 | suspension | 1 | 50
1 | Honda | 15000 | brakes | 1 | 50
基本上,该数据集表示某个客户id在mileage12000 处维修过发动机和悬架。过了一会儿,他回来了,并在mileage15000 修理了刹车。我清楚地理解这一点mileage,repair_type应该将其作为time series data. 我也有一个分类和数字变量。我应该重新组合数据集吗?是否应将每条客户记录转置为一条记录?在那种情况下,随着数据的混合时间,我应该尝试预测什么 ml 算法 repair_type