DNA在法庭案件中的使用

机器算法验证 可能性 生物统计学 生物信息学 合法的
2022-04-11 02:25:32

我目前正在研究Neil Owen的以下案例,根据以下文章我找到了一份报纸:

“一名 20 岁的学生昨天因残忍强奸和谋杀一名女学生而被判终身监禁,这是英国犯罪史上最大的 DNA 测试项目之一。尼尔欧文在谋杀案发生一年后被捕,当时他的基因指纹被在对庄园内的 2000 名男子进行大规模 DNA 筛查后,与现场发现的 DNA 相匹配。他住在离受害者家只有 100 码的地方。实验室测试显示,其他任何人成为凶手的可能性是 1.6 亿分之一。

现在首先我知道这里存在检察官谬误的问题。因为1.6亿分之一在实际指的是P(matching blood type evidence|innocence)时被解释为P(innocence|matching blood type evidence)。但我的问题是指辩护的推理。

辩方律师指出,英国约有 3000 万男性,并辩称欧文有罪的正​​确概率约为16/19,不足以在排除合理怀疑的情况下定罪。所以我的两个问题是

1. 你认为 16/19 这个数字是怎么计算出来的?(我确定使用了 3000 万人口和 1.6 亿分之一的概率?)

2. 做了哪些隐含的假设,它们的合理性如何?

1个回答
  1. 假设您假设 1.6 亿分之一是 P(匹配 DNA 证据|随机人),那么 16/19 的数字大致是英国其他 3000 万男性中没有一个也匹配 DNA 证据的机会:二项式机会为 0命中,给定 3000 万次试验,p = 1/1.6 亿。对于这个概率,我得到大约 0.83,而 16/19 大约是 0.84。由于 19/23 是我计算的概率的更好近似值,我不确定他们是否是这样得到的。
  2. 对谁的假设?律师?如果我是对的,他做出了错误的假设,即另一个具有匹配 DNA 的人的存在意味着他的客户是无辜的。但在这 3000 万男子中,许多人的不在犯罪现场和/或生活远离犯罪现场,这使他们成为凶手的先验概率相对微乎其微。

从统计数据来看,假设他有罪是有道理的。如果我们衡量凶手经常住在附近,因此他是 2000 人中的一员的可能性有多大,我们可以计算概率。假设它相对较低,例如 5%。让 G 是有罪的人是 2000 的一部分的事件,让 E 是 2000 中至少有一个测试为阳性的事件。

然后

P(G|E)=P(E|G)P(G)P(E).

P(G) 假定为 0.05 并且P(E|G)如果实验室工作正常,应该是 1 左右。在实践中它可能略低,所以我们假设它只有 0.9。其他

P(E)=P(E|G)P(G)+P(E|!G)P(!G)=0.050.9+p0.95
其中 p 是 2000 年中至少有 1 个阳性结果的二项式概率,命中概率为 1/1.6 亿。事实证明这是很小的,p大约是0.000012. 这意味着我们得到P(E)=0.045
P(G|E)0.99974.