我正在玩FIFA 帕尼尼在线贴纸专辑,它是经典帕尼尼专辑的互联网改编版,这些专辑通常为世界杯足球赛、欧洲锦标赛以及可能的其他锦标赛发行。
这张专辑有 424 种不同贴纸的占位符。游戏的目的是收集所有 424。贴纸一包 5 个,可以通过在线找到的代码获得(或者,如果是经典印刷专辑,则在当地报摊购买)。
我做出以下假设:
- 所有贴纸均以相同数量发布。
- 一包贴纸不包含重复。
我怎样才能知道我需要获得多少包贴纸才能合理地确定(比如说 90%)我拥有所有 424 个独特的贴纸?
我正在玩FIFA 帕尼尼在线贴纸专辑,它是经典帕尼尼专辑的互联网改编版,这些专辑通常为世界杯足球赛、欧洲锦标赛以及可能的其他锦标赛发行。
这张专辑有 424 种不同贴纸的占位符。游戏的目的是收集所有 424。贴纸一包 5 个,可以通过在线找到的代码获得(或者,如果是经典印刷专辑,则在当地报摊购买)。
我做出以下假设:
我怎样才能知道我需要获得多少包贴纸才能合理地确定(比如说 90%)我拥有所有 424 个独特的贴纸?
这是一个美丽的优惠券收藏家的问题,由于贴纸以 5 个一包的形式提供,因此有点扭曲。
如果贴纸是单独购买的,结果是已知的,如您所见。
单独购买贴纸的 90% 上限的所有估计值也是一包 5 个问题的上限,但上限不太接近。
我认为使用 5 个依赖包获得更好的 90% 概率上限会变得更加困难,并且不会给您带来更好的结果。
所以,使用尾部估计和和,你会得到一个很好的答案。
编辑:
参考 Assuranceturix 带来的文章《The collector's problem with group drawing》 (Wolfgang Stadje) 给出了针对 Coupon Collector's Problem with "sticker packs" 的精确解析解。
在写定理之前,一些符号定义:将是所有可能的贴纸的集合,.将是您感兴趣的子集(在 OP 中,), 和. 我们将绘制,替换,的随机子集不同的贴纸。将是元素的数量至少出现在这些子集中的一个中。
定理说:
因此,对于 OP,我们有和。我对经典优惠券收集器问题(729 包)的估计值值进行了一些尝试,我得到 k 等于700的概率为 90.02% 。
所以它离上限并不远:)
前几天我看到一篇论文解决了一个密切相关的问题:
http://www.unige.ch/math/folks/velenik/Vulg/Paninimania.pdf
如果我理解正确,您需要购买的预期数量为:
但是,正如 eqperes 在评论中指出的那样,OP 提出的具体问题实际上已在另一篇非开放访问的论文中详细介绍。
他们的最终结论提出了以下策略(对于 660 张贴纸的专辑):
总计 140 包 + 最多 15 包额外的贴纸(按成本计价),以有针对性的方式购买,最多相当于155 包。