我有两年以下的数据集,每个数据集包含大约 10.000 条记录。每周都会生成一份新报告,显示当前或任何前一个月的绩效。因此,最近的每周报告将覆盖先前报告的月度值(针对该特定月份)。我需要根据收到的每周数据来预测今年的表现。
我有两个问题:
- 我需要如何构建我的数据集以进行机器学习?如果我保留上述内容,我将获得大约 150 个功能(每周 3 个),我不知道是否有一个 ML 算法可以处理我需要运行的一年中的许多 n/a(所有未来几周)预测。我还可以通过将每周的三列组合成三个特征来将其转换为一个新的数据集(这将导致长窄表)。但这将复制每个实体和输出值大约 50 次(每周一次)。
- 基于1的答案。什么是合适的训练算法?
