假设我正在构建一个像 Uber 这样的应用程序,我想根据用户过去的历史、当前的经纬度以及当前的日期和时间来预测用户最有可能的目的地。
我们有数百万用户,但每个用户的需求可能太独特而无法概括。即,每个人的通勤方式是如此不同,以至于您从其他用户那里学到的东西可能不适用于其他用户。
总之,我必须构建数百万个模型,如何将这些模型合并在一起以获得更好的部署过程?如果不是,部署数百万个模型的最佳实践是什么?
假设我正在构建一个像 Uber 这样的应用程序,我想根据用户过去的历史、当前的经纬度以及当前的日期和时间来预测用户最有可能的目的地。
我们有数百万用户,但每个用户的需求可能太独特而无法概括。即,每个人的通勤方式是如此不同,以至于您从其他用户那里学到的东西可能不适用于其他用户。
总之,我必须构建数百万个模型,如何将这些模型合并在一起以获得更好的部署过程?如果不是,部署数百万个模型的最佳实践是什么?
在这种情况下,特征工程是游戏的名称。几年前我偶然发现了一个类似的问题,有一个模型也不能很好地概括所有情况可能会令人困惑。然而,一个用户的一个模型永远不会是要走的路,毕竟在很多情况下,你只有一个特定于该用户的数据点。此外,如果出现新用户,您将永远无法做出预测。
因此,您需要为尽可能多的用户使用一种模型。还有更多方法,但我认为这些是值得考虑的方法。
tl博士 找到一种方法,将多个用户用于一个泛化良好的模型,因为为一个人训练一个模型永远不会奏效,因为用户通常只有一个数据点。因为,所有算法都需要大量数据才能很好地泛化。