Google Trip Bundle 的工作原理是什么?

数据挖掘 聚类 算法
2022-03-13 09:53:02

Google Trip 现在正在将旅行项目自动聚类到旅行包中。

https://support.google.com/inbox/answer/6228360?hl=zh-CN

因此,如果您的邮件中有与同一行程相关的航班确认邮件和酒店确认邮件,Google 会自动将它们聚集到一个行程包中。

这意味着:

  1. 他们扫描你所有的电子邮件
  2. 他们找到与旅行有关的
  3. 他们将同一次旅行的人聚集成一个包。

我的问题与第 3 点有关。执行此类任务需要哪种算法?

考虑到该任务是无人监督的,因为用户在创建捆绑包时无法与系统交互。

1个回答

公司机密 - Google 不会透露他们实际使用的内容。对此的任何回答纯属猜测。

它可能甚至不仅仅是“一个”算法,而是很多。但这可能就像查找重叠的日期和地点一样简单,假设人们不能同时在两个地方。您可以对此进行测试:在同一时间间隔内预订不同目的地的航班和酒店。如果它们仍然显示为一次“旅行”,我不会感到惊讶(并且它并没有真正降低用户体验)。

这很可能是一种有监督的方法。这并不意味着“交互式”。相反,无监督方法可能需要交互来选择参数。不过,使用一些训练数据(例如,来自员工或用户交互)来提高匹配质量看起来很有希望。