我是 1300 年出生的特定人的后裔的可能性有多大?

机器算法验证 可能性 随机过程 遗传学
2022-02-11 10:34:54

换句话说,根据以下,什么是p?

为了使这个问题成为数学问题而不是人类学或社会科学,并简化问题,假设在人口中以相等的概率选择配偶,除了兄弟姐妹和堂兄弟从不交配,而且配偶总是从同一个一代。

  • n1 -- 初始种群
  • g代数。
  • c每对夫妇的平均子女数。(如果有必要回答,假设每对夫妇的孩子数量完全相同。)
  • z没有孩子的人的百分比,他们不被认为是夫妻的一部分。
  • n2 -- 最后一代的人口。应该给出n2z
  • p - 最后一代中的某人是初始一代中特定人的后代的概率。

当然,这些变量可以更改、省略或添加。为简单起见,我假设不会随时间变化。我意识到这将得到一个非常粗略的估计,但这是一个起点。cz

第 2 部分(进一步研究的建议):

你怎么能认为配偶不是以全球统一的概率选择的?实际上,配偶更有可能具有相同的地理区域、社会经济背景、种族和宗教背景。如果不研究这方面的实际概率,这些因素的变量将如何发挥作用?这会有多重要?

4个回答

因为这个问题得到的答案从天文数字小到几乎 100% 不等,我想提供一个模拟,作为改进解决方案的参考和灵感。

我称这些为“火焰图”。每一个都记录了群体中遗传物质在离散世代中繁殖时的分散情况。这些图是描绘人的细垂直线段的阵列。每一行代表一代,开始的一代在顶部。每一代的后代都在紧挨着它的下一行。

的人口中只有一个人被标记并绘制为红色。(很难看到,但它们总是绘制在顶行的右侧。)它们的直系后代同样用红色绘制;它们将出现在完全随机的位置。其他后代被绘制为白色。因为人口规模可以从一代到下一代有所不同,右侧的灰色边框用于填充空白空间。n

这是一组 20 个独立的模拟结果。

火焰图

红色遗传物质最终在其中九个模拟中消失,剩下的 11 个(55%)幸存者。(在左下角的一种情况下,看起来整个种群最终都灭绝了。)然而,无论哪里有幸存者,几乎所有的种群都含有红色遗传物质。这提供了证据表明从上一代中随机选择的个体含有红色基因的机会约为 50%。

该模拟通过随机确定每一代开始时的存活率和平均出生率来工作。生存率来自 Beta(6,2) 分布:平均为 75%。这个数字既反映了成年前的死亡率,也反映了那些没有孩子的人。出生率来自 Gamma(2.8, 1) 分布,因此平均为 2.8。结果是一个残酷的故事,即生殖能力不足以弥补普遍的高死亡率。它代表了一个极其悲观的最坏情况模型——但是(正如我在评论中所建议的)人口增长的能力并不是必不可少的。每一代人最重要的是人口中红色的比例

为了对繁殖进行建模,通过抽取所需大小的简单随机样本,将当前人口减少到幸存者。这些幸存者是随机配对的(配对后剩下的任何奇怪的幸存者都不会繁殖)。每对产生一些从泊松分布中抽取的孩子,其平均值是这一代的出生率。如果父母中的任何一个包含红色标记,则所有孩子都会继承它:这模拟了通过任一父母直接血统的想法。

此示例从 512 人口开始,并运行 11 代(包括开始的 12 行)的模拟。这个模拟的变化从人,使用不同的存活率和出生率,都表现出相似的特征:到代结束时(在这种情况下为 9),大约有 1/3 的机会所有的红色都消失了,但如果还没有消失,那么大多数人口都是红色的。再过两到三代,几乎所有的种群都是红色的,并将保持红色(否则种群将完全消失)。n=8214=16,384log2(n)

顺便说一句,一代人的存活率达到 75% 或更少并不是幻想。1347 年晚期,鼠疫首次从亚洲进入欧洲。在接下来的三年中,大约 10% 到 50% 的欧洲人口因此而死亡。瘟疫在数百年后几乎每一代人都会复发一次(但通常不会以同样的极端死亡率)。


代码

模拟是使用Mathematica 8 创建的:

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm

当您尝试计算祖先时会发生什么?

你有 2 位父母,4 位祖父母,8 位曾祖父母,......所以如果你回到代,那么你有祖先。让我们假设平均一代长度为年。然后从 1300 年以来大约有代,这给了我们当时大约 2.68 亿个祖先。n2n2528

这是正确的球场,但这个计算有问题,因为 1300 年的地球人口混合不均匀,我们忽略了你们祖先“树”内的通婚,即我们重复计算了一些祖先。

与 1300 年的人口的比率得出正确的上限,即 1300 年随机选择的人是你的祖先的概率上限228

你越往后走,你就越有可能与一个成功地传递了他们当时生活的基因的人有关。在您生活在 1300 年的 1/40 亿祖先中,他们中的许多人会在您的家谱中出现数百次(如果不是数千次,数百万次)。与我们的祖先相比,遗传漂移和我们与某人直接相关的次数可能与我们的遗传密码差异更相关。

概率是=1-z,这个问题中的每个后代都与上面的祖先有关。无论初始繁殖率是 (1-z) 是您作为初始种群中某人的后代的概率。唯一不确定的概率是在最终种群中存活的机会。

我同意 Erad 的回答,尽管我现在认为它回答了一个没有被问到的问题——即考虑到你的祖先的某些已知的生殖和人口限制,你活着的概率是多少。