我正在开发一个预测应用程序,其目的是让进口商预测其分销商客户网络对其产品的需求。只要有足够的库存来满足需求,销售数据就可以很好地代表需求。但是,当库存降至零时(我们希望帮助客户避免这种情况),我们不知道我们错过了多少目标。如果供应充足,客户会进行多少销售?使用销售额作为简单目标变量的标准基于回归的 ML 方法将对时间、我的描述性变量和需求之间的关系产生不一致的估计。
Tobit 建模是解决问题的最明显方法:http ://en.wikipedia.org/wiki/Tobit_model 。我想知道随机森林、GBMS、SVM 和神经网络的 ML 适应,它们也解释了数据的左手审查结构。
简而言之,我如何将机器学习工具应用于左删失回归数据,以获得对我的因变量和自变量之间关系的一致估计?首选是 R 中可用的解决方案,其次是 Python。
干杯,
亚伦