我很难理解为什么人们使用他们找到的任何向量作为推荐系统的候选者。
在我看来,推荐系统需要一个距离代表相似性的空间。当然,在构建这样的空间之前,首先需要确定要使用的距离类型(欧几里得、角度或其他任何距离)。然后你需要一个模型(假设我们正在谈论 ML)来将你的输入(可以是图像、文本或其他任何东西)映射到该空间中的某个点。这个模型的一个主要方面是它知道我们定义的距离类型。如果模型中没有距离的概念,那么模型的输出肯定不会具有“距离意味着相似”的属性。
我问这个问题是因为我看到人们使用他们找到的任何向量来构建推荐系统。这是一个将 VAE 的潜在向量用于推荐系统的示例:
我还看到人们以同样的方式使用fastText词嵌入。我知道所有这些嵌入/潜在向量在它们的空间中形成具有一些有趣模式的集群。但我认为这不足以假设推荐系统的“距离代表相似性”要求。
如果我在这里遗漏任何东西,请告诉我。