每周,我的我和朋友们参加了一个酒吧测验可用积分。在任何给定的一周里,只有我们中的一些人在那里。记录成员的存在/缺席一周内在矩阵中.
我想建立一个预测模型来预测我们在任何一周内获得的分数,这取决于谁在那里。一个简单的模型是假设每个问题都同样难,并且该玩家有概率知道任何问题。那么我们得到一个给定问题正确的概率是
因此,我们得分的概率点是
和的对数似然是
我可以编写一个最大化此数值的例程,以找到的最大似然估计量。然而,由此产生的估计严重地过度拟合数据(可以通过交叉验证检测到)。
中引入一个惩罚(正则化)项,它惩罚大概率或小概率。据我了解,这相当于对有先验。但是,我不知道这个先验应该是什么形式。惩罚项的两个简单选择是:
和
但这些都是非常临时的。我很想知道一个合适的先验共轭是什么(假设一个甚至存在)。有什么提示吗?