积极事件,但不确定何时发生

数据挖掘 数据清理 数据
2022-03-04 14:04:59

早晨,

我有很多数据,其中一个事件(目标数据/我想预测的未来事件)发生在两周的时间范围内,但我不确定它何时发生在这个时间范围内。

我可以获得每日或更频繁的特征数据,但目标数据只出现在 2 周的间隔内,或者在某些情况下 4 周的间隔内。

目前,我在时间范围内使用任何特征的平均值,或者在目标数据可用的同一天收集特征数据,但有更合适/更好的方法吗?

我将这些数据用于机器学习目的。

1个回答

这被称为“间隔审查”:也就是说,您知道事件发生在一个间隔内,但不知道该间隔的确切位置。

我认为 ML 社区对区间删失数据(或任何,真的)没有太多关注。然而,在统计界,包括我自己在内的数量是合理的。因此,我为区间删失回归模型编写了R包。icenReg回归模型当然可以用作 ML 工具,尽管这些模型还没有更典型的 ML 问题的所有花里胡哨(即没有惩罚回归和弹性网络等)。

但是,icenReg至少包含一个用于通用交叉验证的工具,尽管它对公众是隐藏的。可以提取出来icenReg:::icenReg_cv