我正在研究一种机器学习模型,该模型将部署在在许多国家/地区运营的产品中。
我遇到的问题如下:我应该
- 训练一个模型并为所有国家服务?
- 每个国家训练一个模型并在其国家服务每个模型?
我已经多次遇到这个问题,对我来说,在学习中需要权衡:在第一种情况下,模型有更多的数据要学习,而且它会更健壮(而且,解决方案更简单) . 在第二种情况下,我将为每个国家/地区提供更量身定制的模型,并且能够看到特定于该国家/地区的效果。
我很想知道是否有中间解决方案——一个带有一些特定国家微调的通用模型,它可以查看所有数据,但也专门针对每个特定国家。如果我使用神经网络,这种微调是很自然的——你用所有数据训练一些时期,然后是每个特定国家的最后一个时期。我想知道是否可以在线性回归模型和 Xgboost 中做类似的事情,这是我通常使用的模型。
有这方面的文献吗?我认为这是一个通用的话题,应该有一些。