如何处理影响未来地面实况数据的机器学习模型?

数据挖掘 机器学习 分类
2022-03-02 09:20:09

我想知道引导业务流程的二进制分类问题是否真的是二进制的。如您所见,转向意味着影响业务流程的结果。因此,地面实况数据将不同于没有模型的情况。

有什么策略可以解决这个问题(除了一个保留组)。最近我阅读了http://ieeexplore.ieee.org/document/7280527/ ,其中还包含早期反馈。

是否适合假设在这种预测 0 和 1 类标签的模型的初始启动后,延迟最多 30 天返回的未来地面实况数据实际上最多为 6 类:

  • 0 预测标签 0
  • 1标签1的预测
  • 反馈标签实际上是
    • 0 表示 0 的预测(常规结果)
    • 1 表示 1 的预测(常规/期望的结果)
    • 0 表示 1 的预测(模型确实错误分类,groundtruth 受影响)
    • 1 表示 0 的预测(模型未检测到分类、次优且损失了一些钱,但认为基本事实不受影响)

反馈如何被纳入?您是否建议将二元分类扩展到多类分类?

1个回答

一种选择是强化学习(RL)。

RL 将问题描述为不确定性下的顺序决策。有一个代理做出决定,做出决定后,代理收集新数据。下一轮决策使用新数据。

您所描述的是“真实情况”的分布随时间变化的情况。许多统计和机器学习模型假设一个静态过程,其中基础分布不随时间变化。某些类型的 RL 不假设一个平稳的过程。