生成人工时间序列数据

数据挖掘 Python 时间序列
2022-02-06 12:44:36

谁能提供有关以编程方式人工生成时间序列数据的方法的建议。如果可能,模拟现有数据集的分布(例如每小时的湿度读数)并在需要时添加一些噪音。任何建议将不胜感激!

2个回答

这篇文章非常适合在 python 中生成时间序列数据。希望这可以帮助。

https://towardsdatascience.com/basic-time-series-manipulation-with-pandas-4432afee64ea

import pandas as pd
from datetime import datetime
import numpy as np
date_rng = pd.date_range(start='1/1/2018', end='1/08/2018', freq='H')

这是生成时间戳,每小时数据

type(date_rng)

pandas.core.indexes.datetimes.DatetimeIndex

创建一个数据框并为相应的日期添加随机值

df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))

您有自己生成的时间序列数据。希望这个有帮助。