我究竟如何从时间戳中提取特征以进行机器学习?

数据挖掘 机器学习 特征提取 特征工程
2022-02-18 11:19:24

我的数据集有一个时间戳列,格式如下:06/24/18 0:56 我如何将这些信息转换为可用于逻辑回归等分类算法的特征?

2个回答

时间序列分类问题的一种常见方法是将连续的数据流划分为一定持续时间的样本。

这称为滑动窗口分割

在此处输入图像描述

您并没有真正使用时间戳作为特征,因为它们在未见数据的分类过程中没有用处。想象一下,用 2018 年获得的数据训练一个模型,并尝试对 2019 年的数据进行分类。信息不是日期,而是其他特征的值!

欢迎来到本站!如果您发布您正在使用的语言,您会得到更好的答案,但我会假设 python。您需要做的最基本的事情之一就是将其分解为组件。因此,假设您在 pandas 数据框中的列名为“client_date”。你可以使用:

# Convert the date to something python understands
df['client_date'] = pd.to_datetime(df['client_date'])
# Get a year
df['client_year'] = df['client_date'].dt.year
# Get a month
df['client_year'] = df['client_date'].dt.month

我想你明白了,这将有助于你开始接下来的研究。祝你好运!