互联网上有很多关于爱国者队的垃圾统计数据,但我只是好奇那些精通统计数据的人对此有什么看法。
主要问题是 - 在什么情况下,NFL 球队 (x) 的赛季失误 (y) 分布是正态分布?在什么情况下不会?
我的想法很简单——如果每场比赛/赛季每支球队的失误率相等(这是一个很大的假设),这将是一个正态分布。
非随机的、独立的因素——比如球员的技能、比赛指挥、教练、激励、主场质量、潜在的作弊或其他任何因素——对失误的影响越多,看起来就越不正常率。
我的思维过程是否正确?
我还听到很多人评论说,NFL 球队每个赛季的失误分布实际上是泊松分布。
我以前处理过泊松分布,这看起来很荒谬,而且完全偏离基础,尽管我可能是错的。泊松分布不是通常用于完全不同的情况吗?我认为它用于建模什么时候可能会在接下来的一个小时内打来电话,或者当骰子可能在 N 次投掷后出现 6 时。我可以看到 N 次比赛的建模失误分布,但比较 NFL 球队的赛季失误?
任何想法都值得赞赏——我对这个媒体问题不太感兴趣——我几乎不喜欢足球——我对数字更感兴趣。我什至不认为这里有问题的数据(爱国者队的失误率是一个异常值)在任何情况下都没有被收集或挪用来回答正确的问题。