数据挖掘 - 结果抖动？为什么随机打乱结果？ - 吾爱随笔录

数据挖掘机器学习

2022-03-10 19:45:09

我们大多数人都希望构建一个尽可能准确的推荐引擎，然而，一位经验丰富的首席数据科学家认为，实用的机器学习算法应该随机打乱结果，因此结果不是最优的。这称为“结果抖动”。幻灯片 15：

虽然我了解如何做到这一点（添加一个小的固定高斯噪声），但我们为什么要这样做以使性能更差。

1个回答

这不是答案，而是评论。我需要 50 声望才能发表评论。

我认为从本质上讲，推荐问题是搜索/优化问题的贪婪算法。然而，这个过程是有偏见的和局部的。用户看到他们看到的东西并做出反应，算法只会加强它。抖动是一种打破偏见并使搜索更加全球化的方法。

我一直在做的与抖动有点不同，但想法相似。我没有排名，而是将匹配分数转换为对数线性概率，并按概率“排序”项目/人。一个例子是，P(a)=0.2，P(b)=0.8，那么 b 有 80% 的机会在上面，而 a 有 20% 的机会在上面。

也想听听其他人是如何听到的。

其它你可能感兴趣的问题