我正在开发一个保险风险预测模型。这些模型属于“罕见事件”,如航空公司未出现预测、硬件故障检测等。在我准备数据集时,我尝试应用分类,但由于负例比例很高,我无法获得有用的分类器.
除了高中统计课程之外,我在统计和建模数据方面没有很多经验,所以我有点困惑。
首先想到的是,我一直在考虑使用非齐次泊松过程模型。我根据事件数据(日期、纬度、经度)对其进行分类,以便对特定时间特定地点特定时间特定时间的风险机会进行良好估计。
我想知道,预测罕见事件的方法/算法是什么?
你推荐什么方法来解决这个问题?
我正在开发一个保险风险预测模型。这些模型属于“罕见事件”,如航空公司未出现预测、硬件故障检测等。在我准备数据集时,我尝试应用分类,但由于负例比例很高,我无法获得有用的分类器.
除了高中统计课程之外,我在统计和建模数据方面没有很多经验,所以我有点困惑。
首先想到的是,我一直在考虑使用非齐次泊松过程模型。我根据事件数据(日期、纬度、经度)对其进行分类,以便对特定时间特定地点特定时间特定时间的风险机会进行良好估计。
我想知道,预测罕见事件的方法/算法是什么?
你推荐什么方法来解决这个问题?