我有一个客户购买数据集,该数据集来自一家拥有在线商店和离线商店的零售商。因此,客户在他们的购物渠道中有两种选择,线上或线下。在网上购物时,需要支付运费,但如果购物篮尺寸大于 50 美元,则无需支付运费。
我发现了一些证据表明客户正试图添加一些物品以使他们的购物篮尺寸大于50,因为这样做可以免除他们的运费。
- 在这种情况下,我试图通过使用机器学习算法来识别和表征仅因为运输阈值而购买的物品。
如果没有运费门槛,50. 我没有观察到那些类型的物品(由于运输门槛而添加的物品)。
- 是否有任何机器学习算法可以识别这些物品?
我想我需要使用一些无监督的机器学习算法。
另一个具有挑战性的部分是每个客户都有不同的特征,所以我可能也需要考虑它。我怎样才能检测到这些类型的项目?