我如何在统计上重新表述这个问题

机器算法验证 回归 统计学意义 贝叶斯 p 值 序列分析
2022-04-01 15:38:48

我正在分析一个数据集,其中包含来自游戏中玩家n次尝试的观察结果。如果我正在构建一个回归模型来预测每次尝试的结果,给定关于每个玩家尝试的 1 个或多个描述符,那么在给定我们的数据集的情况下,我如何衡量玩家在任何特定描述符变得“有意义”或“重要”之前必须进行多少次尝试?

一个很好的例子是一群人玩飞镖。一个绝对的新手可能会闭上眼睛,投掷飞镖并击中靶心。显然,我们知道这纯粹是机会,他以前从未参加过比赛,而且他甚至可能会陶醉。但是,假设他在这 5 次中又投掷了 5 次飞镖并击中靶心 3 次。他现在已投掷 6 次飞镖并击中靶心 50% 的时间。现在事情越来越可疑了……

这位真正的新手在什么时候会投出足够多的靶心飞镖,他需要多少次尝试才能说他拥有超越其他更有经验的球员的严重天赋?统计学中的这个术语是什么,我在哪里可以了解更多信息?

免责声明:我尽量避免使用诸如“重要性”和“观察”之类的加载统计术语,尽管我觉得它们在这里的某些地方是合适的。

如果有人能指出我正确的方向,那就太好了。谢谢!!

1个回答

飞镖是最简单的游戏。每位选手以 501 分开始,轮流投掷 3 支飞镖。计算每回合的分数并从玩家总数中扣除。Bullseye 得分 50,外环得分 25,双环或三环中的飞镖计为分段得分的两倍或三倍。

图片来自http://www.shotdarts.com/darts-info/play-darts

现在已经在别处检查了这些概率。在那个网站上,我们被告知“一个中等水平的飞镖运动员会有更大的标准偏差;即使平均而言,射门可能围绕同一个目标,但它们将分布在更广泛的区域。一个差劲的飞镖运动员会具有很高的标准偏差,并且他们的镜头将在概率上分散在更广泛的区域中。” 即, 飞镖分数

因此,为了回答这个问题,我们做我们一直在做的事情。我们建立了一个得分直方图,对于游戏本身,我们可以使用 501 得分,然后我们拟合一个密度函数,然后我们针对其他玩家的密度函数测试该密度函数。因此,我们需要足够的数据,以便我们的位置及其偏差有足够的预测能力来正确区分玩家。数据越少,答案就越模糊,而且没有神奇的数字,越多越好。