所以,我有这个数据集,其中每个实例由 2 个变量的过去 20 个样本组成。标签是接下来的五个样本。所以每个实例看起来像这样:
Instance1_feature = [s1_var1 s2_var1 ... s20_var1 s1_var2 s2_var2 ... s20_var2]
Instance1_label = [s21_var1 s22_var2 ... s25_var5 s21_var2 s22_var2 ... s25_var2]
Instance2_feature = [s2_var1 s3_var1 ... s21_var1 s2_var2 s3_var2... s21_var2]
Instance2_label = [s22_var1 s23_var2 ... s26_var5 s22_var2 s23_var2 ... s26_var2]
所有数据都是分类的。var1 在 {1,2,3,4,5} 中取值;var2 取值 {6,7,8,9,10} 我熟悉机器学习。因此,我正在寻找一种方法来开发模型来预测新实例的标签。我有理由相信,通过查看过去的样本,可以预测未来的样本。就像股票价格一样。
任何帮助,代码示例的链接将不胜感激。
编辑这是我在开车时收集的数据集。鉴于我有过去 20 秒的数据,我想看看我是否可以预测接下来 5 秒的驾驶。这就是我创建这样的特征向量和标签的原因。值 {1,2,3,4,5} 和 {6,7,8,9,10} 是分类的,因为变量被分成多个段。