这是我第一次在这里发帖。我通常在SO上。所以我不确定这些问题是否适合 DS stackexchange。我真的需要对此发表意见。
我有什么数据 -
+-----------+------------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+------+-------+------+-------+------+----------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+----------+----------+----------+----------+
| Day | Date | 0:0 | 0:30 | 1:0 | 1:30 | 2:0 | 2:30 | 3:0 | 3:30 | 4:0 | 4:30 | 5:0 | 5:30 | 6:0 | 6:30 | 7:0 | 7:30 | 8:0 | 8:30 | 9:0 | 9:30 | 10:0 | 10:30 | 11:0 | 11:30 | 12:0 | 12:30 pm | 1:00 pm | 1:30 pm | 2:00 pm | 2:30 pm | 3:00 pm | 3:30 pm | 4:00 pm | 4:30 pm | 5:00 pm | 5:30 pm | 6:00 pm | 6:30 pm | 7:00 pm | 7:30 pm | 8:00 pm | 8:30 pm | 9:00 pm | 9:30 pm | 10:00 pm | 10:30 pm | 11:00 pm | 11:30 pm |
+-----------+------------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+------+-------+------+-------+------+----------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+----------+----------+----------+----------+
| Tuesday | 01/01/2019 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 9 | 9 | 8 | 8 | 8 | 8 | 1 | 1 | 9 | 4 | 10 | 10 | 8 | 8 | 8 | 4 | 4 | 8 | 8 | 8 | 4 | 8 | 5 | 5 |
| Wednesday | 02/01/2019 | 8 | 9 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 9 | 9 | 5 | 9 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 9 | 1 | 1 | 1 | 9 | 12 | 12 | 3 | 3 | 10 | 10 | 4 | 4 |
+-----------+------------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+-----+------+------+-------+------+-------+------+----------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+----------+----------+----------+----------+
每行是一天,有 48 列。每列是半小时时钟,从午夜开始到晚上 11:30。列中的每个数字代表一个特定类别。
例如,如果我们看到Tuesdayat column的第一行0:0,则值为 2。这里 2 代表类别 - 社交时间。同样,1 代表类别 - 睡眠,所有数字都说明了我在一天中的特定时间所做的事情。
我有大约过去 2 年的数据,所以大约有 700 x 48 个数据点。
我的目标是什么——
根据这些数据,我想预测我的下一个/未来的一天或一小时
我卡在哪里了-
我的预测变量是entire row(当天)或单次column(30 分钟)。我的第一个想法是旋转整个数据,对每个响应变量进行一次热编码,然后考虑应用哪个分类模型。但随后每一天也与前一天有关。所以这不仅仅是一个分类问题。它也有一些回归。
我很难以哪种方式准备数据并继续。
我要什么——
一种处理此类数据集的方法。
我不一定要寻找要应用的模型。我主要关心的是了解in which way如何准备我的数据,以便它可以在模型中使用。
任何帮助、指导、类似的问答或相关文章都会有所帮助。