从血型分布推断等位基因分布

机器算法验证 分布 多项分布 遗传学
2022-04-14 10:23:14

美国的血型分布如下(根据这个链接):

O 45%
A 40%
B 11%
AB 4%

然而,血型是一个人从父母那里获得的 2 个等位基因(小写)的结果。

aa -> A
oa -> A
ao -> A
oo -> O
ob -> B
bo -> B
bb -> B
ba -> AB
ab -> AB

如何{a,b,o}从已知的血型分布中提取等位基因的分布{O,A,B,AB}

2个回答

血型的概率可以根据等位基因来定义:

O=o2
A=a2+2oa
B=b2+2ob
AB=2ab

这些是具有 3 个变量的 4 个方程,因此不能保证有解。

求解我们得到的前 3 个方程:

o=O
a=A+OO
b=B+OO

我们得到:

o=0.6708203932499369
a=0.25113405247935183
b=0.07751108410485141

因此

AB=2ab=0.03893134532663842=3.9%

这与您描述的数字非常接近

编辑:这里的逻辑错误,忽略这个答案并专注于接受的答案。

保留原件以供参考。


简单地反转概率怎么样?这听起来很简单,但它可能是您正在寻找的?

如果 aa、oa 和 ao 构成 A 并且有 40% 的 A,那么最简单的假设是每个等位基因对有 40/3 %,依此类推

这给出,以%

aa -> 13.3 
oa -> 13.3
ao -> 13.3
oo -> 45
ob -> 3.7
bo -> 3.7
bb -> 3.7
ba -> 2
ab -> 2

然后,您对具有“a”的对的概率求和,并根据它们在对中的频率进行思考(例如 ao 中的 *0.5,aa 中的 *1.0)

其中给出,以%为单位

a = 13.33 + 13.33 + 2  =  28.66
b = 3.66 + 3.66 + 2   =  9.33
o = 13.33 + 45 + 3.66 =  62.00