数据挖掘 - 评估交错推荐系统结果同时减少偏差的最佳方法 - 吾爱随笔录

我已经问过这个问题，但我的措辞与我想问的问题完全不同。我没有删除旧问题，以防有人发现它有用。

给定两个推荐系统，系统 A 和系统 B。用户将听来自两个系统的一些歌曲，并在 6 分中对每首歌曲进行评分。然后，我将根据它们是系统 A 还是 B 对评分进行分组，并找到平均评分来评估哪个系统更好。

我想知道哪个是交错 A 和 B 推荐的最佳系统，这样可以最大限度地减少偏差。

我目前已经实现了 2 种方法。首先是每个用户只听过一个系统的推荐，所以歌曲都是AAAAA或BBBB。这导致了一个问题，如果 A 在客观上比 B 好，那么如果用户给 B 评分为 3，例如，如果他们也听过 A，那么对 B 的评分可能会更低，因为它相对更好。例如，如果用户只听 A 并且平均评分为 3，则同样适用。如果他们听了 B，更糟的是，它可能会收到更高的评价，因为人们并不完全客观。因此，这种方法引入了对更好系统的偏见。

第二种方法是用户以 50/50 的几率收听来自任一系统的歌曲。AABBABABBAA 等。这个系统消除了第一个系统的偏差问题，但是它引入了另一个。如果好的系统给出好的推荐，而坏的系统给出了不好的推荐，用户可能会允许对它进行更好的评价，因为他们被好的推荐“投入了好心情”。如果坏系统继续提出坏建议，同样适用，因为坏系统会“让用户心情不好”，所以好系统的评级将被降低。因此，这种方法还引入了对更好系统的偏见。

我的推理是否错了，如果没有，是否有更好的方法来交织两个系统的结果，同时最大限度地减少偏差？

谢谢