如何处理像小时这样的循环特征?

数据挖掘 特征工程
2022-03-02 16:20:36

假设我想预测我早上是否健康。一个特点是我最后一次上网。现在这个功能很棘手:如果我计算小时,那么分类器可能会遇到困难,因为 23 在数字上更接近 20 而不是 0,但实际上 23 点钟的时间更接近于 0 点钟。

是否有一种转变可以使这更加线性?可能进入多个功能?(好吧,如果我在几分钟内做同样的事情,希望不是 60 个功能)

1个回答

该问题已经发布,您可以在那里找到答案:

什么是转换循环序数属性的好方法?

这个想法是将您的时间特征转换为两个特征:就像您将小时表示为时钟上指针的角度,并使用角度的 sin/cos 作为您的特征