费舍尔精确检验与权重?

机器算法验证 假设检验
2022-03-05 06:18:46

有谁知道费舍尔精确检验的一种变体,它考虑了权重?例如采样权重
因此,与通常的 2x2 交叉表不同,每个数据点都有一个称量该点的“质量”或“大小”值。

示例数据:

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

Fisher's Exact Test 然后使用这个 2x2 交叉表:

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

如果我们将权重作为数据点的“实际”数量,这将导致:

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

但这会导致太高的信心。一个数据点从 N/Y 变为 N/N 会在统计中产生非常大的差异。
另外,如果任何重量包含分数,它就不会起作用。

3个回答

我怀疑“精确”测试和抽样权重本质上是不相容的概念。我检查了Stata,它具有良好的抽样调查设施和合理的精确测试设施,并且其具有样本权重的交叉表的8个可能的测试统计不包括任何“精确”测试,例如Fisher's。

相关的 Stata 手册条目(对于svy: tabulate twoway)建议在所有情况下都使用其默认测试。此默认方法基于通常的 Pearson 卡方统计量。去引用:

“为了考虑调查设计,通过使用二阶 Rao 和 Scott (1981, 1984) 校正,将统计量转换为具有非整数自由度的 F 统计量”。

参考:

  • Rao、JNK 和 AJ 斯科特。1981. 来自复杂样本调查的分类数据分析:双向表中拟合优度和独立性的卡方检验。美国统计协会杂志七十六:221—230。
  • Rao、JNK 和 AJ 斯科特。1984.关于根据调查数据估计的细胞比例的多路列联表的卡方检验。统计年鉴 12:46-60。

有趣的问题。你说的重量是什么意思?

我倾向于做一个引导程序......选择你最喜欢的统计数据(即Fisher's Exact),然后根据你的数据计算它。然后根据您的零假设为每个实例分配新单元格,并重复该过程 999 次。这应该为您在零假设下的检验统计量提供一个很好的经验分布,并且可以轻松计算您的 p 值!

关于样本权重的一个简单的事情——它们通常是一种合并一些关于从中抽样的总体信息的方法——但它们通常基于“大样本”类型的场景(通常是变相的受限 BLUP 或 BLUE 预测)。所以我想样本权重可能不会比没有权重好。我认为更好的是使用样本设计直接基于的人口信息。

例如,选择概率的计算依据是什么?我敢打赌,您知道不涉及 A 或 B 的人口总数或某种人口细分(例如按性别划分的年龄)。如果这不正确,那么我将浪费一些空间,但如果它是正确的,并且假设你有人口总数R1,,Rk为了k组(或分层),并且在每个组中,您都有一个“迷你” 2 x 2 列联表。所以我们现在可以写R1;11,R1;12,R1;21,R1;22,作为我们推理的“目标”。或者也许是总和l=1kRl;ij那是推理的目标(人口中有多少人给出响应N / N??)。然后你试图推理Rl;ij从抽样数字rl;ij受限于i,jRl;ij=Rl为了(l=1,,k). (最大的人?)

请注意,如果抽样概率仅基于您可能收到的数据,那么它们是无关紧要的(并且适用Fisher 精确检验),因为一旦您收到数据,您就知道收到了什么样本。所以连贯的事情是将采样概率更新为P(Dm)=1如果第 m 个单位在样本中,并且P(Dm)=0如果他们不在样本中。然而,通常设计基于更多的信息,而不仅仅是人们可能观察到的数据。但请注意,重要的是信息而不是调查设计本身。基于设计的推理只是将所有信息整合到分析中的一种相当有效的方法。