我们大多数人都希望构建一个尽可能准确的推荐引擎,然而,一位经验丰富的首席数据科学家认为,实用的机器学习算法应该随机打乱结果,因此结果不是最优的。这称为“结果抖动”。幻灯片 15:
http://cikm2013.org/slides/ted.pptx
虽然我了解如何做到这一点(添加一个小的固定高斯噪声),但我们为什么要这样做以使性能更差。
我们大多数人都希望构建一个尽可能准确的推荐引擎,然而,一位经验丰富的首席数据科学家认为,实用的机器学习算法应该随机打乱结果,因此结果不是最优的。这称为“结果抖动”。幻灯片 15:
http://cikm2013.org/slides/ted.pptx
虽然我了解如何做到这一点(添加一个小的固定高斯噪声),但我们为什么要这样做以使性能更差。
这不是答案,而是评论。我需要 50 声望才能发表评论。
我认为从本质上讲,推荐问题是搜索/优化问题的贪婪算法。然而,这个过程是有偏见的和局部的。用户看到他们看到的东西并做出反应,算法只会加强它。抖动是一种打破偏见并使搜索更加全球化的方法。
我一直在做的与抖动有点不同,但想法相似。我没有排名,而是将匹配分数转换为对数线性概率,并按概率“排序”项目/人。一个例子是,P(a)=0.2,P(b)=0.8,那么 b 有 80% 的机会在上面,而 a 有 20% 的机会在上面。
也想听听其他人是如何听到的。