语境
- 您有 200 次观察个人跑步时间的 100 米,每天测量一次,持续 200 天。
- 假设个人在开始练习之前不是跑步者
- 根据观察到的数据和其他 199 个观察结果,您想估计个人在 (a) 施加最大努力时跑步所需的潜伏时间;(b) 对他们来说有相当好的运行(即运行没有重大问题;但仍然是典型的运行)。让我们称之为潜在的潜力。
当然,实际数据不会直接测量潜在潜力。数据会很嘈杂:
- 时间会因运行而异
- 在某些日子里,由于一个或多个可能的问题(例如,开始时绊倒,中途抽筋,没有付出太多努力),个人会特别慢。此类问题将导致大量异常值
- 在某些日子里,这个人会比你预期的要慢,可能是因为更多的小问题。
- 一般来说,通过练习,预计跑步者的潜在潜力会变得更快。
- 在极少数情况下,跑步者的潜在潜力可能会变慢(例如,受伤)
这样做的影响:
- 偶尔的缓慢时间可能会提供有关个人能力的最少信息。
- 一个人的快时间表明这个人有能力这么快,但是这种快时间的一小部分可能是当天的好运(例如,正确的风,开始时有一点运气)。
问题: 因此,如何根据可用数据和一些关于运行时间性质的假设来估计 200 个时间点中的每一个的潜在潜力?
初步想法:我想会有某种形式的贝叶斯方法将可用信息和假设结合起来形成估计,但我不确定在哪里可以找到这样的模型。我也不太清楚如何评估这种模型的有效性。