预测循环目标

数据挖掘 机器学习 特征工程
2022-02-09 22:35:38

我熟悉使用三角函数来转换循环变量以用作训练模型的特征(最常见的是一天中的小时或一年中的一个月);我现在正试图找出使用这些类型的变量作为模型目标的最佳方法。(例如,想象一个模型预测特定事件最有可能发生的月份)。既不使用严格递增的表示(因此 2018 年 1 月接近 2017 年 12 月,但距离 2017 年 1 月很远)也不将月份视为分类变量是理想的,但对特征进行的三角编码需要sin同时cos部分具有每个月的唯一表示,因此使用两者中的一个也不是可行的方法。我错过了更好的选择吗?

1个回答

相关术语是“多输出”或“多目标”回归/分类。几年前的一篇调查文章一些很好的讨论。此功能在许多包中实现(例如,在sklearn(它扩展了其他回归器的功能,而不是作为独立实现)和R中。