考虑以下示例:
您患有一种罕见疾病,其发生似乎取决于一定数量的变量。您建立了一个模型,该模型试图预测最有可能受到部分成功疾病影响的患者,也就是说,它以一定的准确性预测疾病的可能发作,但低于预期。理想情况下,随着有关该疾病患者的更多历史数据的出现,您会更新模型,并且准确性开始提高。
最终,您开始通知高危患者并为他们提供应对这种疾病的步骤。正因为如此,越来越多被归类为高风险的患者实际上并未感染该疾病,从而降低了模型的准确性。从某种意义上说,该模型是其自身成功的“受害者”。
是否有任何策略来处理此类预测场景:旨在预测不良结果的模型由于成功避免了现实世界案例中的结果而失去准确性?