我已经问过这个问题,但我的措辞与我想问的问题完全不同。我没有删除旧问题,以防有人发现它有用。
给定两个推荐系统,系统 A 和系统 B。用户将听来自两个系统的一些歌曲,并在 6 分中对每首歌曲进行评分。然后,我将根据它们是系统 A 还是 B 对评分进行分组,并找到平均评分来评估哪个系统更好。
我想知道哪个是交错 A 和 B 推荐的最佳系统,这样可以最大限度地减少偏差。
我目前已经实现了 2 种方法。首先是每个用户只听过一个系统的推荐,所以歌曲都是AAAAA或BBBB。这导致了一个问题,如果 A 在客观上比 B 好,那么如果用户给 B 评分为 3,例如,如果他们也听过 A,那么对 B 的评分可能会更低,因为它相对更好。例如,如果用户只听 A 并且平均评分为 3,则同样适用。如果他们听了 B,更糟的是,它可能会收到更高的评价,因为人们并不完全客观。因此,这种方法引入了对更好系统的偏见。
第二种方法是用户以 50/50 的几率收听来自任一系统的歌曲。AABBABABBAA 等。这个系统消除了第一个系统的偏差问题,但是它引入了另一个。如果好的系统给出好的推荐,而坏的系统给出了不好的推荐,用户可能会允许对它进行更好的评价,因为他们被好的推荐“投入了好心情”。如果坏系统继续提出坏建议,同样适用,因为坏系统会“让用户心情不好”,所以好系统的评级将被降低。因此,这种方法还引入了对更好系统的偏见。
我的推理是否错了,如果没有,是否有更好的方法来交织两个系统的结果,同时最大限度地减少偏差?
谢谢