考虑以下场景:
Alice 订阅了允许她观看电影的视频租赁服务。每次 A 看一部电影时,她都会给它打大拇指 (1) 或大拇指向下 (0),然后她会选择她想看的下一部电影。每部电影只属于一位导演,一位导演可以导演多部电影。问题是,确定谁是 A 的“最喜欢”的导演的最佳方法是什么?
我最初的想法是做类似的事情:
- 对于 A 看过的至少一部电影的每位导演,计算某个二项式置信区间(例如Wilson 得分区间)的下限作为 A 对该导演的“好感度”得分
然而,这种二项式方法似乎有缺陷,因为它忽略了一条看似关键的信息:爱丽丝有整个世界可供选择的电影,如果她一直选择观看某个导演的电影,那么这不是告诉我们一些关于她对那位导演的偏好,即使她随后对该导演的电影评分低于她的平均水平?我觉得如果我们只考虑观看的电影的收视率,肯定会有一些“用脚投票”的元素被忽略。
将电影/导演的选择与个别电影的收视率结合起来确定谁是 A 最喜欢的导演的最佳方法是什么?似乎 A 对导演 D 的偏好必须是 A 对她观看的 D 电影的评分以及 A 选择观看的所有 D 电影的百分比的函数。
更新:我应该说清楚,我正在处理的问题并不像竖起大拇指/竖起大拇指的情况那么简单,它实际上更像是“A 看了一部电影,然后如果她喜欢它就勾选一个框。” 因此,每次观看都会导致 0 或 1,但没有选中一个框与“大拇指向下”并不完全相同,因为如果她真的喜欢,观众可能只会觉得有必要选中“批准”框某物。更有理由选择观看什么必须考虑到偏好