为匹配概率预测选择正确的算法

数据挖掘 机器学习 分类 可能性 计分 天蓝色毫升
2022-03-07 18:53:30

寻求帮助来启动新的机器学习场景。在这种情况下,我需要将一个实体(例如人)与一组实体(例如其他人)配对,并给出一段时间内匹配模式的历史记录。

例如:假设我们有一些人喜欢其他人,这些人具有身高、体重、教育水平等综合特征……在计算概率时,这种“喜欢”的表示法是双向的。当一个新人到来时,我想隔离一组人(按概率排名)来推荐他们。

在这种情况下,输入将是具有所有特征的单个人,而输出将是具有匹配概率排名的人的列表。似乎有两组主要数据

  • 知名人士
  • 已知人喜欢或不喜欢的特征与他们喜欢或不喜欢的人的特征

我比较新,所以不确定要使用哪种类型的训练模型。例如,这是否可以通过线性回归模型、二元分类、boost-tree's、matchbox 等来最合理地完成?可能我需要一个组合。

我正在使用 Azure 机器学习工作室,它有很多选择,但我只是不确定在这种情况下从哪里开始。任何建议或指示将不胜感激

1个回答

这似乎是电影推荐问题的一种变体。以 Netflix 为例,他们对不同类型的电影有用户评分;在您的情况下,用户正在告诉他们喜欢什么属性。当新用户加入并对他/她喜欢的事物进行评分时,您会发现兴趣相似的人,再次与 Netflix 类比,这意味着根据与新用户具有相同品味的人推荐电影。

阅读用于构建推荐系统的协作过滤。我之所以画 Netflix/电影推荐类比,是因为你可以找到很多关于它的文献。