所以我有一个奇怪的现实世界问题,其中将被馈送到分类预测模型的数据具有(一些)某些特征,并且在构建模型时,我可以使用额外的数据集来为其中一些特征添加上下文,但是当它要实时运行时,我将无法使用任何额外的数据——模型本身需要已经“知道”原始数据的特定值的重要性,并且能够仅对这些属性进行操作.
这里的主要特征是城市内的时间(/日期/DOW)和位置(纬度/经度)。因此,附加数据集是关于该位置(分区、人口统计、交通)或时间(交通、商业活动等)的上下文。但是出于性能原因(加入成本等),我们不能实时使用它们,我们只有时间和位置编号(加上易于解析的衍生产品)。
我正在想象一个过程,模型使用这些附加功能来了解时间和位置的哪些子集或分界实际上很重要,然后即使没有附加功能,也可以继续使用这些权重和规则或其他任何东西,只是依靠数值。但也有可能没有这种方法。任何人都可以提出一种算法或方法来让我们保留一些价值吗?