消失的老鹰统计分析

机器算法验证 统计学意义 分类数据 缺失数据
2022-03-28 17:33:25

不同标签型号的标签命运总结

带有卫星标签的老鹰在苏格兰失踪了,上表显示了标签型号的标签命运。我对那些“停止 - 无故障”的标签特别感兴趣,因为这些鸟也可能被杀死,尸体和标签正在被处理掉。

我已经看到它说这张表和这张表本身就是证据,“即使是最遥远的统计分析,也很明显“停止 - 无故障”和使用的标签类型之间存在关系”所以我的问题是,这可以吗?声明被备份?

42/135  (31%) tags stopped for all types 
 8/17   (47%) tags stopped for 80NS     
29/77   (38%) tags stopped for 70GPS    
 3/22   (14%) tags stopped for 105GPS   
 2/13   (15%) tags stopped for 70GSM    
 0/6     (0%) tags stopped for 95BTOGSM 

因此,如果 47% 的 80NS 故障率明显低于 31% 的全球平均水平,我猜这个说法是正确的。如果在 135 个标签中的 17 个随机样本中出现 8 个失败的概率实际上非常高,那么这将是不正确的。更抽象地说,如果一个袋子里有 42 个黑球和 93 个白球,我随机挑出 17 个,我选 8 个黑球和 9 个白球的概率是多少?

我可以计算出前 8 个为黑色的概率为 (42/135) * (41/134) 等,但我一直在尝试计算 17 个中的任何 8 个为黑色的可能性


编辑:卫星标签在 2004 年至 2016 年的 13 年期间附在鸟类身上。此表显示 131 个标签而不是 135 个。排除了 4 个标签,因为它们无法确定四个早期标签的精确部署位置。

按标签年份的标签类型

以下是报告中的另一个表格,其中显示了有关 70GPS/70GSM 标签寿命的一些数据:

停止无故障标签运行时间

1个回答

我找到了一种从math.stackexchange上的评论“查找超几何分布”中得到答案的方法:

来自维基百科关于超几何分布的条目

在概率论和统计学中,超几何分布是一种离散概率分布,它描述了 n 次抽奖中 k 次成功(绘制对象具有指定特征的随机抽奖)的概率,无需替换。

然后,使用在线超几何计算器和下图:

人口:135

人口成功数:42

样本量:17

样本成功数:8

我发现恰好得到 8 的概率是 0.0703,得到 8 或更多的概率是 0.1095

我认为在这种情况下,“8 或更多”的数字是相关的,我不得不说这个概率低于我的直觉预测。

因此,这些数字表明,当按标签类型隔离时,故障率有 89% 的可能性存在差异。这并不意味着差异的原因标签类型。