相当于二项式/泊松变量的 t 检验

机器算法验证 t检验 p 值 泊松分布 skellam分布
2022-04-11 12:53:01

我必须尝试估计和解释在有限数据集上可能极低的转化率。

因为我的观察结果很少,所以正常的框架会给我一个糟糕的估计,因为人口乘以转化率太小,以至于我的二项式定律无法收敛到正常定律。

因此,我想知道我可以应用什么样的测试来比较这些?

==> 我需要回答的问题:我们对 A 转化率高于 B 的信心有多大?

我害怕使用 t-stat,因为我不知道我们离融合到正常框架有多近,一个典型的例子是:

样本 A = 100 000 次尝试,20 次成功 样本 B = 100 000 次尝试,15 次成功

我们假设 Success(A) 和 Success(B) 是参数 100 000 和 lambda(A) 的独立二项式分布(分别是 lambda(B) )

我想到了几个变种:

我正在考虑设置 H0 = {lambda(A)=lambda(B)=Average conversion of both} 并测试 p 值 = P(Success(A)-Success(B) > 观察值),并逼近 A 和B as Poisson 在我的示例中,在 H0 中,lambda(A)=lambda(B)=0.000175,并且 Success(A)-Success(B) 是Skellam 分布但是,有没有办法计算重新分区函数?我对平均转化率的假设是否有点夸张?

-> 我想我也可以寻找最大化 p 值的 lambda,但理论上解决起来更加复杂

-> 我也想知道我应该使用单边还是双边置信区间

基本上,我无法将 t-stat 方法调整为非同方差和非连续变量,所以我想知道关于 p 值的基本问题。

对此的任何来源(即在极限中心定理发挥作用之前发生的事情)也将受到欢迎。

第一次在这里发帖,不要犹豫,告诉我另一个交流是否更适合我的问题。

1个回答

在统计术语中,您观察到两个独立的二项式随机变量X1Bin(n1,p1)X2Bin(n2,p2)并想检验原假设H0:p1=p2. Fisher 精确检验在这里是合适的。在您的示例中,您有n1=n2=100000并观察X1=20X2=15. P值可以在R中计算如下:

fisher.test(matrix(c(20,15,100000-20,100000-15),2,2))

给予P=0.4995在你的例子中。由于与成功次数相比,每种情况下的试验次数(100000)都很大,因此泊松随机变量的相关检验实际上给出了相同的结果:

poisson.test(c(20,15))

给予P=0.4996.

编辑:这些计算基于双面替代方案,但如果需要单面测试,则可以轻松调整。