我正在尝试为运送的产品何时到达目的地创建一个模型。交付经历了几个阶段,因此不仅仅是从 A 点到 B 点的行驶时间。我的第一个模型查看第一阶段的产品状态,并使用该产品时间的平均交付时间来预测 #产品交付的第一阶段后的几分钟。我想制作另一个模型,它可以提供更多的连续预测,同时考虑到交付在某个阶段已经持续了多长时间。例如,如果大多数交付是在 15 分钟后在第一阶段完成的,并且已经 10 分钟,那么模型应该在 eta 中考虑到这一点。我将如何处理这个?我可以在 # 分钟内喂它' 作为输入,我一直处于阶段,但似乎我可以为每个示例提供大量数据。抱歉,如果这不是一个明确的问题。
连续预计到达时间
数据挖掘
回归
2022-02-09 22:30:10
2个回答
如果我理解正确(不确定),在我看来您不需要可以随时预测的模型,您只需要:
- 在给定过去阶段的信息的情况下预测任何阶段的 ETA 的模型。最简单的方法可能是为每个阶段训练一个不同的模型,因为阶段的数量是固定的。
- 然后在两个阶段之间,ETA 可以确定性地更新:如果最后一个阶段在某个时间通过并且预计的 ETA 是说 1000 万,然后在时间ETA只有1000万——.
很多时候,从简化问题开始是有意义的。在您的情况下,您可以将其视为回归问题 - 基于所有可用功能的从发货到到达的总时间。以这种方式建模是故意无状态的,忽略顺序阶段。
然后开始增加复杂性。更复杂的建模将使用基于状态的条件概率,例如概率图模型 (PGM)。与线性回归相比,PGM 更难拟合。性能的边际收益可能不值得额外的建模复杂性。
其它你可能感兴趣的问题