如何预测罕见事件的发生?

人工智能 机器学习 人工智能设计 应用 预言
2021-11-06 18:06:55

我试图预测犯罪。我有带有因素的数据:地点、犯罪的关键词描述、犯罪发生的时间等等。这是针对过去发生的罪行。

我想将犯罪预测视为二元分类问题。在这个模型中,我收集的数据将形成“积极”的例子:它们都是犯罪发生的例子。但是,我不确定用什么来处理负面例子。

显然,大多数时候该地点没有犯罪,但我可以将其用作负面数据吗?例如,如果我知道晚上 7 点在地点 X 发生了犯罪,并且那里没有其他犯罪,我是否应该在晚上 7 点以外的每个小时生成新的负数据点?

理想情况下,我想根据一组因素创建犯罪概率。

2个回答

它可能会提供更多信息:

  1. 用犯罪率标记每个犯罪地点、类型和时间的组合例如,在水晶城晚上 11 点发生的盗窃事件每年发生 20 次,或每位居民每年 0.4 次。

  2. 预测犯罪率而不是个别事件。

这避免了需要明确的“非犯罪”示例,而是让您直接了解与犯罪概率(比率)相关的内容。

我什至会说,除非训练示例包含谓词数据(即有关导致犯罪或非犯罪的条件的数据),否则您将无法获得足够的信息来根据条件或条件预测犯罪的发生。在尚未实施的潜在犯罪之前发生的事件。