我需要多少张贴纸才能完成我的 FIFA 帕尼尼专辑?

机器算法验证 可能性 优惠券收集问题
2022-02-13 02:30:40

我正在玩FIFA 帕尼尼在线贴纸专辑,它是经典帕尼尼专辑的互联网改编版,这些专辑通常为世界杯足球赛、欧洲锦标赛以及可能的其他锦标赛发行。

这张专辑有 424 种不同贴纸的占位符。游戏的目的是收集所有 424。贴纸一包 5 个,可以通过在线找到的代码获得(或者,如果是经典印刷专辑,则在当地报摊购买)。

我做出以下假设:

  • 所有贴纸均以相同数量发布。
  • 一包贴纸不包含重复。

我怎样才能知道我需要获得多少包贴纸才能合理地确定(比如说 90%)我拥有所有 424 个独特的贴纸?

2个回答

这是一个美丽的优惠券收藏家的问题,由于贴纸以 5 个一包的形式提供,因此有点扭曲。

如果贴纸是单独购买的,结果是已知的,如您所见

单独购买贴纸的 90% 上限的所有估计值也是一包 5 个问题的上限,但上限不太接近。

我认为使用 5 个依赖包获得更好的 90% 概率上限会变得更加困难,并且不会给您带来更好的结果。

所以,使用尾部估计P[T>βnlogn]nβ+1n=424nβ+1=0.1,你会得到一个很好的答案。

编辑

参考 Assuranceturix 带来的文章《The collector's problem with group drawing》 (Wolfgang Stadje) 给出了针对 Coupon Collector's Problem with "sticker packs" 的精确解析解。

在写定理之前,一些符号定义:S将是所有可能的贴纸的集合,s=|S|.AS将是您感兴趣的子集(在 OP 中,A=S), 和l=|A|. 我们将绘制,替换,k的随机子集m不同的贴纸。Xk(A)将是元素的数量A至少出现在这些子集中的一个中。

定理说:

P(Xk(A)=n)=(ln)j=0n(1)j(nj)[(s+nljm)/(sm)]k

因此,对于 OP,我们有我对经典优惠券收集器问题(729 包)的估计值值进行了一些尝试,我得到 k 等于700的概率为 90.02% 。l=s=n=424m=5k

所以它离上限并不远:)

前几天我看到一篇论文解决了一个密切相关的问题:

http://www.unige.ch/math/folks/velenik/Vulg/Paninimania.pdf

如果我理解正确,您需要购买的预期数量为:

(4245)j=1424(1)j+1(424j)(4245)(424j5)

但是,正如 eqperes 在评论中指出的那样,OP 提出的具体问题实际上已在另一篇非开放访问的论文中详细介绍。

他们的最终结论提出了以下策略(对于 660 张贴纸的专辑):

  • 买一盒100包5贴(500贴,保证不一样)
  • 再购买 40 包 5 个贴纸并交换重复的贴纸,直到您最多丢失 50 个贴纸。
  • 直接从帕尼尼购买剩余的贴纸(这些贴纸的价格约为 1.5 倍)。

总计 140 包 + 最多 15 包额外的贴纸(按成本计价),以有针对性的方式购买,最多相当于155 包