编码时间值

数据挖掘 Python 神经网络 scikit-学习 数据清理
2022-02-28 23:38:22

在继续训练我的神经网络之前,我正在使用 Python/Scikit 进行数据编码。我有几列看起来像这样

07:05:00
08:41:00
17:25:00
12:58:00
08:56:00
11:59:00
17:25:00
15:24:00

关于如何编码的任何建议?或者就这样离开它好吗?

2个回答

“特征工程”中的一个常见步骤是将这些解析为多个值,这些值可能会在 ML 期间为您提供额外的信息。例如:

  • 一天中的小时
  • 小时的分钟
  • 日出后数小时
  • 日落前几小时

如果您也有一天,那将打开更多来检测季节性,例如:

  • 一年中的月份
  • 季度月份
  • 一周中的天
  • 假期是/否

我决定将字符串转换为秒。由于这些都是时间值,我会将它们转换为连续的秒数。

https://stackoverflow.com/questions/10663720/converting-a-time-string-to-seconds-in-python