我有一个数据集,其中特征集由一天中的小时(0 到 23 之间)、星期几(周一到周日)、商店数量(正整数)和道路类别(序数范围内的 0 到 8 )组成)。我希望预测行人数量,这是一个连续变量。因此,我正在寻找一种回归方法,并沿着使用 KNN 的思路进行思考。它适合这项任务吗?我特别担心小时和天数据,因为它们本质上是循环的。
df_test[['Day', 'Time','shop_count','road_category','pedestrian_volume']].iloc[0:5]
Day Time shop_count road_category pedestrian_volume
0 Tuesday 20 22 0 210.0
1 Tuesday 21 13 4 196.0
2 Tuesday 22 39 4 214.0
3 Tuesday 23 2 8 46.0
4 Wednesday 0 15 8 18.0