下面是一些数据的直方图,bin 是整数,其他参数无关紧要。
如您所见,奇数和偶数似乎有两个独立但重叠的正态分布。
成为偶数的概率是 1/3,同样是奇数的 2/3。
老实说,我不知道它的实际统计意义,所以我试图找出它甚至是为了了解更多信息,但我找不到任何东西,我已经尝试了很多搜索词来找到这个,甚至反向图像搜索,但我得到的只是有关多模态分布等的信息,我找不到任何关于多模态分布何时以这种方式重叠的信息
有这个名字吗?
对于那些感兴趣的人,数据来自使用 matlab 脚本的 1,000,000 个 goofspiel (N=13) 随机游戏
N = 1000000;
random = zeros(1,N);
for i = 1 : N
pc = randperm(13);
p1 = randperm(13);
p2 = randperm(13);
random(i) = sum(pc.*sign(p1-p2));
end
histogram(random,'BinMethod','integer')
一个更一般的(虽然是人为的)示例如下
a = [1:50 50:-1:1];
b = normpdf(linspace(-2,2),0,0.5).*50;
c = a;
rng('default') %For reproducibility
d = logical(randi([0,1],1,length(a)));
for i = 1:length(c) %There's gotta be a way to do this without an explicit loop
if(d(i))
c(i) = b(i);
end
end
bar(c)
像第一个例子一样,有两个分布重叠(三角形和正态),但在这种情况下,不是在每个点交替,而是随机的。
我知道这是一个夸大的例子(甚至不是直方图),但必须有这样的例子实际发生在统计数据上,对吧?那么也许不是,或者它完全无关紧要?
实际问题有两个:
一般问题 -这种类型的“东西”叫什么,如果有的话?- 以便我(或任何其他可能遇到它的人)可以了解更多关于它的信息以及是否需要进行任何调整。
这个问题与我的第一个数据集特别相关 - 我应该将奇数和偶数值分开还是将正态分布拟合到整个数据集?