什么是“____边缘的条件反射”?

机器算法验证 术语
2022-03-26 11:15:22

“条件在____的边缘”是什么意思?我缺乏统计/数学训练,像这样的短语让我迷惑不解,不知道该去哪里找。

在这篇文章中(哪些是超几何分布和卡方分布之间的区别),有一个例子,@Glen_b 使用了这个短语:

也就是说,您的示例数据如下所示:

            Drawn    Not drawn    Total

   Red      160        6520        6680
   Black    222       11938       12160

   Total    382       18458       18840

查看作为随机变量绘制的红球的数量,它具有超几何分布(尽管根据从瓮中提取的白球和黑球而不是从宇宙中提取的红球和黑球来表示)。

[边缘条件给出超几何-这也是基于超几何的Fisher精确检验的情况,也是通常的2x2卡方关联检验/独立检验适用的情况之一。如果你不在两个边距上都设置条件,那么你就没有超几何;但这就是您通常在您描述的特定球入瓮模型中所做的。]

1个回答

边距

这里的margins是指表格边缘(margins!)上的数值,即红色总数、黑色总数、抽奖总数、未抽奖总数。相关术语边际分布是指通过对其他变量进行平均而从几个变量的联合分布中获得的单个变量的分布(从词源上讲,该术语确实来自写在表格边缘的值)。

调理

条件化是指计算条件分布,即给定一些信息的概率分布。这里,对边距进行调节意味着边距是固定的,即我们假设总共有 6680 个红球(和 12160 个黑球),以及 382 个已抽出的球(和 18458 个未抽出的球)。所以,例如

       Drawn  Not drawn  Total
Red      200       6480   6680 
Black    182      11978  12160
Total    382      18458  18840

将是我们随机分布的可能实现(边距相同)。在绘制和球的颜色是独立的零假设下,对边缘的调节会导致超几何分布。

或者,如果实验是这样的,直到获得 160 个红色球,则以边缘为条件是没有意义的(因为被抽球的总数可能不是 382 个)。在这种情况下,可以获得类似的实现

       Drawn  Not drawn  Total
Red      160       6520   6680 
Black    182      11978  12160
Total    342      18498  18840

这将有不同的利润。