考虑下面提供的示例数据集;
|ShopID| |Transactions| |dist_to_shop|
S1 15478 0
S2 12345 0.41
S3 17865 0.11
S4 35479 0.57
S5 74589 0.35
数据集由ShopID、Transactions和dist_to_shop(以米为单位)字段组成。假设所有商店都属于一个零售商,我想通过根据距离分配权重/业务规则来找出交易/人员访问到其他商店的分布。
例如,权重可以给出:
0-200 Meters = 40%
201-400 Meteres = 30%
401 & Above = 20%
问题- 如果 ShopID S3 关闭并且可能的 transactions/people_count 根据提供的距离权重在其他商店中拆分或分发,会发生什么情况。它类似于假设分析。如果商店倒闭,我想知道交易的分布情况。
我的数据集几乎与我上面提供的数据集相似。我想知道解决这种情况的最佳方法。哪个 ML/统计模型最适合。
任何投入都将证明是非常有价值的。
编辑: 2019 年 2 月 25 日所做的更改