德国坦克问题是关于从序列号的随机样本中估计一组对象的总大小。
它可以简单地通过以下方式完成:
在哪里是观察到的最高序列号,并且是样本数。
我想找到增长率(假设是线性的),这很容易通过将旧的估计值与新的估计值进行比较来找到。
然而:
最新的估计应该部分考虑较旧的数据。
假设我昨天观察了几个序列号,今天观察了几个,我想找到增长。天真的解决方案是对每一天进行独立估计,然后进行比较。但很明显,昨天的观察对于新的估计也很有价值,例如,如果观察到的最高序列号更高。
我如何解释老化的数据,同时仍然补偿它来自较少的序列号的事实?
澄清编辑:
这是指原始坦克估计问题,假设新坦克的产量是恒定的(每天添加相同的数量)。负生产是不可能的,车辆的潜在损失被忽略。我正在寻找的是一种生产率不变的模型,尽管欢迎进行概括。
这归结为:给定不同日期的罐序列号观察列表,我如何找到生产率?