陪审团选择的偏见?

机器算法验证 可能性 统计学意义 参考 偏见 组合学
2022-03-04 20:56:45

在一次刑事审判之后,一位朋友代表一位客户上诉,其中陪审团的选择似乎存在种族偏见。

陪审团由 4 个种族组的 30 人组成。检方使用强制性挑战将其中 10 人从池中剔除。每个种族群体的人数和实际挑战的数量分别为:

A: 10, 1
B: 10, 4
C:  6, 4
D:  4, 1
total: 30 in pool, 10 challenges

被告来自 C 族群,而受害者来自 A 族和 D 族群,因此先验关注的是 C 组是否受到过度挑战,而 A 组和 D 组是否受到挑战不足。从法律上讲(IIUC;IANAL),辩方不需要证明种族偏见,而只是证明数据似乎表明存在偏见,然后将责任推给检方,以非种族的方式解释每个挑战。

以下分析的方法是否正确?(我认为计算很好。):

有 nCr(30,10) = 30,045,015 个不同的集合,每组 10 个池成员。在这些不同的集合中,我计算出 433,377 个集合包括(不超过 2 个 A 组和 D 组的成员)(不少于 4 个 C 组的成员)。

因此,达到观察到的偏向于 A 组和 D 组而不是 C 组的明显偏差水平的机会(其中偏向意味着不包括在 10 个挑战的集合中)将是这些的比率,433/30045 = 1.44%。

因此,零假设(没有这种偏差)在 5% 的显着性水平上被拒绝。

如果这个分析在方法上是正确的,那么向法庭描述它的最简洁的方式是什么,包括学术/专业参考(即不是维基百科)?虽然这个论点看起来很简单,但如何才能最清楚、最简洁地向法庭证明它是正确的,而不是恶作剧呢?


更新:这个问题正在考虑作为上诉摘要中的第三个论点。鉴于此处讨论的技术复杂性(从律师的角度来看)以及明显缺乏法律先例,律师选择不提出它,所以此时的问题主要是理论/教育问题。

回答一个细节:我相信挑战的数量,10,是预先设定好的。

在研究了深思熟虑和具有挑战性的答案和评论(谢谢大家!)之后,这里似乎有 4 个单独的问题。至少对我来说,将它们分开考虑(或听取为什么它们不可分离的论点)将是最有帮助的。

1) 在陪审团的挑战中,对被告人和受害者的种族的考虑是否具有先验的法律问题?上诉论点的目的仅仅是提出合理的担忧,这可能会导致司法命令,要求控方说明每个单独挑战的原因。在我看来,这不是一个统计问题,而是一个社会/法律问题,由律师自行决定是否提出。

2)假设(1),我对替代假设的选择(定性:对与被告种族相同的陪审员的偏见,有利于与受害者种族相同的陪审员)是合理的,还是事后不允许的?从我外行的角度来看,这是最令人困惑的问题——是的,如果没有观察到,当然不会提出!据我所知,问题在于选择偏差:一个人的测试不仅应该考虑这个陪审团,还应该考虑所有这样的陪审团,包括所有那些辩方没有观察到差异因此不想提出这个问题的陪审团. 如何解决这个问题?(例如,Andy 的测试是如何解决这个问题的?)尽管我可能错了,但似乎大多数受访者并没有受到潜在的事后问题的困扰1 尾检验仅针对被告群体的偏见。假设(1),同时测试受害者群体的偏见在方法上会有什么不同?

3)如果有人规定我选择(2)中所述的定性替代假设,那么检验它的合适统计量是什么?这是我对回答最困惑的地方,因为我提出的比率似乎是安迪对更简单的“对 C 的偏见”替代假设的测试的一个稍微保守的模拟(更保守,因为我的测试也将所有案例都计算在内在尾部,而不仅仅是观察到的确切计数。)

这两个检验都是简单的计数检验,具有相同的分母(相同的样本范围),并且分子与对应于各自替代假设的样本的频率精确对应。所以@whuber,为什么我的计数测试与安迪的计数测试不同,它“可以基于规定的空[相同]和替代[如所述]假设并使用内曼 - 皮尔森引理证明是合理的”?

4)如果规定(2)和(3),判例法中有没有可以说服持怀疑态度的上诉法院的参考资料?从迄今为止的证据来看,可能不是。此外,在这个上诉阶段,没有任何“专家证人”的机会,所以参考就是一切。

4个回答

以下是我可能会如何使用标准统计工具回答您的问题。

以下是考虑到陪审员的团体成员资格,对被拒绝概率的概率分析结果。

首先,这是数据的样子。我有 30 组观察结果和一个二元拒绝指标:

. tab group rejected 

           |       rejected
     group |         0          1 |     Total
-----------+----------------------+----------
         A |         9          1 |        10 
         B |         6          4 |        10 
         C |         2          4 |         6 
         D |         3          1 |         4 
-----------+----------------------+----------
     Total |        20         10 |        30 

以下是个体边际效应以及联合检验:

. qui probit rejected ib2.group

. margins rb2.group

Contrasts of adjusted predictions
Model VCE    : OIM

Expression   : Pr(rejected), predict()

------------------------------------------------
             |         df        chi2     P>chi2
-------------+----------------------------------
       group |
   (A vs B)  |          1        2.73     0.0986
   (C vs B)  |          1        1.17     0.2804
   (D vs B)  |          1        0.32     0.5731
      Joint  |          3        8.12     0.0436
------------------------------------------------

--------------------------------------------------------------
             |            Delta-method
             |   Contrast   Std. Err.     [95% Conf. Interval]
-------------+------------------------------------------------
       group |
   (A vs B)  |        -.3    .181659     -.6560451    .0560451
   (C vs B)  |   .2666667   .2470567     -.2175557     .750889
   (D vs B)  |       -.15   .2662236     -.6717886    .3717886
--------------------------------------------------------------

在这里,我们正在测试个人假设,即 A、C 和 D 组与 B 组相比被拒绝的概率差异为零。如果每个人都像 B 组一样被拒绝,那么这些将是零。最后一条输出告诉我们,A 组和 D 组陪审员被拒绝的可能性较小,而 C 组陪审员被拒绝的可能性更大。尽管这些迹象与您的偏见猜想一致,但这些差异在单独统计上并不显着。

处三个差异都为零的联合假设p=0.0436


附录:

如果我将 A 组和 D 组合并为一个,因为它们共享受害者的种族,概率结果会变得更强并且具有很好的对称性:

Contrasts of adjusted predictions
Model VCE    : OIM

Expression   : Pr(rejected), predict()

------------------------------------------------
             |         df        chi2     P>chi2
-------------+----------------------------------
      group2 |
 (A+D vs B)  |          1        2.02     0.1553
   (C vs B)  |          1        1.17     0.2804
      Joint  |          2        6.79     0.0336
------------------------------------------------

--------------------------------------------------------------
             |            Delta-method
             |   Contrast   Std. Err.     [95% Conf. Interval]
-------------+------------------------------------------------
      group2 |
 (A+D vs B)  |  -.2571429   .1809595      -.611817    .0975313
   (C vs B)  |   .2666667   .2470568     -.2175557     .750889
--------------------------------------------------------------

这也允许 Fisher 精确给出一致的结果(尽管仍然不是 5%):

 RECODE of |       rejected
     group |         0          1 |     Total
-----------+----------------------+----------
       A+D |        12          2 |        14 
         B |         6          4 |        10 
         C |         2          4 |         6 
-----------+----------------------+----------
     Total |        20         10 |        30 

          Pearson chi2(2) =   5.4857   Pr = 0.064
           Fisher's exact =                 0.060

我认为引入一种特别的统计方法将不会被法院接受。最好使用“标准做法”的方法。否则,您可能会证明您有资格开发新方法。

更明确地说,我认为您的方法不符合 Daubert 标准。我也非常怀疑您的方法本身是否有任何学术参考。您可能不得不聘请统计专家证人来介绍它。我想,这很容易被反击。

这里的基本问题可能是:“陪审团挑战独立于种族分组吗?”

这些是应用渐近统计方法的小数字。但是,在此设置中测试关联的“标准”是测试:χ2

> M <- as.table(cbind(c(9, 6, 2, 3), c(1, 4, 4, 1)))
> dimnames(M) <- list(Group=c("A", "B", "C", "D"), Challenged=c("No", "Yes"))
> M
     Challenged
Group No Yes
    A  9   1
    B  6   4
    C  2   4
    D  3   1

> chisq.test(M)

        Pearson's Chi-squared test

data:  M
X-squared = 5.775, df = 3, p-value = 0.1231

Warning message:
In chisq.test(M) : Chi-squared approximation may be incorrect

使用 Fisher 精确检验给出了类似的结果:

> fisher.test(M)

        Fisher's Exact Test for Count Data

data:  M
p-value = 0.1167
alternative hypothesis: two.sided

关于假设是双面的注释适用于表的情况。2×2

我的解释是,没有太多证据可以证明种族偏见。

之前问过一个类似的问题(这里是我讨论的特定案例供参考)。辩方需要简单地展示 Batson 挑战中歧视的表面案例(假设美国刑法) - 因此假设检验可能比需要的负担更大。

因此对于:

  • n=30人参加 venire 小组
  • p=6小组中 6 名 C 种族的人
  • k=4 C种族的4名陪审员在先发制人的挑战中被淘汰
  • d=10次抢先挑战

Whuber 之前的回答给出了由超几何分布决定的特定结果的概率:

(pk)(npdk)(nd)

在这种情况下, Wolfram -Alpha所说的等于:

(64)(306104)(3010)=7611310.07

不幸的是,除了我提供的链接之外,我没有参考资料——我想你可以从 Wikipedia 页面为超几何分布找到合适的参考资料。

这忽略了种族 A 和 D 是否“受到挑战”的问题。我怀疑你是否可以为此提出法律论据——这将是平等保护条款的一个奇怪的转折,这个特定的群体受到了太多的保护!,我不认为会飞。(虽然我不是律师 - 所以请谨慎行事。)

如果你真的想要一个假设检验,我不知道该怎么做。您可以生成排列,给它一个在零下的概率,根据他们在 venire 中的比例平等地选择种族群体,然后计算在零下您的检验统计量的精确分布。我不太确定什么测试统计数据是令人满意的,并没有真正回答感兴趣的问题。(您可以自己编写测试统计信息 - 我不知道吗?)(3010)χ2


在一篇博文中更新了我的一些想法。我的帖子专门针对 Batson Challenges,因此不清楚您是否寻求其他情况(您对 1 和 2 的更新在 Batson Challenges 的背景下没有意义。)

我能够找到一篇相关文章(可在链接中找到全文):

Gastwirth, JL (2005)。案例评论:对强制性挑战数据分析的统计测试:阐明在约翰逊诉加利福尼亚案中确立初步证据确凿的歧视案例所需的证明标准。法律、概率和风险,4(3),179-185。

这对使用超几何分布给出了相同的建议。在我的博客文章中,我展示了如果将类别折叠成两组,它相当于 Fisher 的精确检验。

Gastwirth 建议就像我在评论中所做的那样,您可以将视为检验统计量,因此如果您愿意,可以Gastwirth 还给出了一个示例,用于根据陪审团的变化数量计算测试统计量。在我的博客文章中,我只是对不同水平的(针对不同情况)进行敏感性分析,以提供可能的百分比范围。kk=5k=6nnd

如果有人意识到实际使用这个(或除分数之外的任何东西)的判例法,我会感兴趣。

让我们不要忘记多重测试问题。想象一下 100 名辩护律师,每个人都在寻找上诉的理由。所有陪审员的拒绝都是通过为每个准陪审员掷硬币或掷骰子来完成的。因此,所有的拒绝都没有种族偏见。

现在,100 位律师中的每一位都进行了你们所有人都同意的任何统计测试。这 100 人中大约有 5 人会拒绝“无偏见”的零假设,并有上诉理由。