鉴于我有一组伯努利实验,每个实验都有一个不同且未知的概率和一个结果,以及一个为每个实验提供事件概率预测的估计器,我想测量估计器的预测质量.
示例:我有一堆 n 个“不公平”硬币,每个硬币正面的概率 ,反面的概率为。概率是未知的,每个硬币我只能掷一次。假设有一个“掷硬币专家”,他可以在掷硬币之前仔细观察每个硬币,并根据形状、大小、宽度、规律性等对概率进行估计。专家做出预测后,掷硬币并记下结果。
抛完所有硬币后,我想衡量专家的水平,例如在 0 和 1 之间的范围内,其中 1 表示完美预测,0 表示纯随机性。我也会对预测变量的偏差/方差感兴趣。