什么样的概率分布更适合每月去商店的频率?

数据挖掘 可能性 模型选择
2022-02-22 09:10:18

我正在制作的模型的一部分包括人们购买给定商品的频率(例如,人们平均每月去超市 n 次)。我试图找出最适合该任务的概率分布。我认为这可以通过泊松过程来建模,因为它涉及跨时间的速率,但我不确定在这种情况下购物的发生是否相互独立。我考虑了一个正态分布,平均值以某个比率为中心,但我也不确定。

1个回答

我认为您对泊松的初步考虑是正确的。我认为您可以假设人们购买给定商品的频率可以被认为是独立的。当然,这个假设可能并不完美(例如,您可能会争辩说 A 人每 3 天购买一次商品 X。但是,如果有足够的人,我认为这并不重要)。总的来说,有时我认为如果你需要使用分布来近似一个过程,你需要选择最好的选择,看起来泊松在这里是最好的。

此外,它不可能是正常的,因为它是有界的(即可以去商店的最低人数是 0)