如何根据用户报告做出决策

数据挖掘 优化
2021-09-19 20:17:00

我有用户报告事故,我想知道如何确保报告的数量足以将该事故视为真正的事故而不是垃圾邮件。

我的想法是考虑特定时间间隔内的最小报告数量,例如 20 分钟内的 4 个报告足以相信该事故的存在。

我的问题是如何选择最少报告的数量和时间间隔?是否有另一种逻辑来做出这个决定?我会很感激你的回答。

1个回答

您不需要为此建立预测模型。也许如果你有用户的数据。但没有其他任何东西,那么您只需要标记数据。您知道它是否是真正的事故的历史数据。

当您拥有标记的数据时,您可以遵循这样的过程,这仍然在很大程度上取决于您的数据类型。

开始迭代您的标记数据集并计算不同组合(5、10、15、20、25、30 ...分钟)和(1、2、3、4、5、6、7)的真实事故报告的准确性等用户)。

您将有一个二维矩阵。我想,对你的情况来说,对事故迅速采取行动很重要。设置一个可接受的精度并选择具有最小间隔的组合,高于该精度。