我正在研究这些年来客户的活动,这些客户每年大约有一次活动。这个结果是许多短时间序列,我发现了它们的分布(按数据中的概率排序的 4 年内命中/未命中):
0000 : 0.31834
0001 : 0.17582
0010 : 0.13605
0100 : 0.13554
1000 : 0.12886
0011 : 0.01717
1100 : 0.01650
0110 : 0.01578
0101 : 0.01220
1010 : 0.01117
1001 : 0.00883
0111 : 0.00571
1110 : 0.00565
1111 : 0.00496
1101 : 0.00384
1011 : 0.00351
显然,一个纯粹不相关的二项式模型是行不通的,但可以观察到,如果 1 和 11 的数量都重合,那么概率大致相等(除了 0001 的小近因效应)。
你能找到一种方法来处理这些数据来推断概率模型吗?基本上我只有几个概率参数可以大致解释这种分布?