捕捞策略的期望值

机器算法验证 可能性 自习 期望值 均匀分布
2022-04-08 13:28:16

假设有一个池塘,里面有无数条鱼。鱼的重量是 iid 均匀的我们按照以下规则从这个池塘捕鱼:(0,1)

  1. 我们每天最多从池塘里钓到一条鱼。
  2. 我们总共需要 3 条鱼,我们有 10 天的时间。
  3. 每天(在捕捞前),如果我们已经有 3 条鱼,我们可以选择放出其中的一条,再钓一条新的。
  4. 我们的目标是最大化我们在第 10 天拥有的 3 条鱼的预期总重量。

最优策略是什么,该策略下的预期权重是多少?

我认为困难在于我们每天只能抓到一只。如果我们被允许释放和捕获任意数量的鱼,问题就变成了著名的骰子问题(见这里)。

这是我在当前设置下的尝试。天结束时 3 条鱼的预期总重量然后我们有 不幸的是,这个公式不能推广到Y_5及以上。YkkY3=1.5

Y4=P(X1+X2+X3Y3)E(X1+X2+X3|X1+X2+X3Y3)+P(X1+X2+X3<Y3)E(X1+X2+X3+X4min(X1,X2,X3)).
Y5

1个回答

按照 whuber 的建议,我们来看一个简单的例子。假设我们需要钓 2 条鱼,我们有 4 天的时间。拥有的两条鱼,最小值用表示。第三天,如果满足以下条件,我释放最小的鱼并重新捕获 其中是在剩余的日子里我可以钓到比我目前的最小值更大的鱼的概率,而是在剩余的日子里我钓到的概率不会钓到比我目前最低限度更大的鱼。x1x2x

(1x2)1+x2+x2x2x>0,
1x2x2(1+x)/2x/2是两种情况下的条件期望。是我必须放弃才能重新捕获的鱼在第三天解决这个不等式,如果我们在第二天拥有的两条鱼中的最小值小于 ,我们将释放并重新捕获。x0.6183

现在让我们转向第四天。同样,我们有 解决这个问题,我们将发布并重新-catch 如果我们在第三天拥有的两条鱼中的最小值小于这是有道理的,因为这是我们最后一次钓到鱼的机会。

(1x)1+x2+xx2x>0,
0.5

在这种策略下,我们注意到

  1. 天不满足释放和重新捕获条件天不满足kk+1
  2. 此公式不取决于所需的鱼总数,而仅取决于剩余天数和,当然是当前的最小值。一般来说,如果 其中是剩余天数。因此,如果有 10 天,如果前两天的最小值小于 ,我们应该在第三天释放并重新捕获。x
    (1xk)1+x2+xkx2x>0,
    k0.81

按照这个策略,最后一天我们的鱼的预期总和是多少?我还没有完全弄清楚。让我们回到简单的例子(2 条鱼,4 天)。第二天,预期的最小值是,平均需要次才能钓到大于的鱼。因此,如果我将其四舍五入到次捕获,那么在最后一天,预期总和将是 /3 ……这些都是非常粗略的想法。1/31.51/324/3