根据利用率和经济数据对 ATM 进行排名(评分/排名模型)

数据挖掘 预测建模 模型选择 评估 计分
2022-02-18 01:50:19

我有过去 3 个月内大约 10 个 ATM 位置的样本数据及其使用次数(存款、取款和其他)。我计划收集其他数据,例如附近的商业利益地点和其他可能需要现金的地方。收集每台自动取款机大约 300 米的数据,即自动取款机附近的商业利益地点。

我想建立一个“评分/排名模型”,它可以考虑所有这些输入,并根据利用率和经济利益地点对这 10 台 ATM 进行排名。

正如我在谷歌上搜索的那样,我找不到任何可以提供解决方案的答案。我对数据科学很陌生,任何输入/建议都会非常有价值。

1个回答

如果您想使用预测模型,那么您需要一个明确定义的目标。在您的情况下,ATM 的使用是一个模糊的术语。你不能像现在这样测量它。如果你解决了这个问题,那么你所看到的就是称为排名方法或学习排名的算法

来自维基百科的摘要

学习排名或机器学习排名 (MLR) 是机器学习(通常是监督、半监督或强化学习)在构建信息检索系统的排名模型中的应用。训练数据由项目列表组成,在每个列表中的项目之间指定了一些偏序。该顺序通常是通过对每个项目给出数字或序数分数或二元判断(例如“相关”或“不相关”)来诱导的。排名模型的目的是进行排名,即以某种意义上与训练数据中的排名“相似”的方式在新的、看不见的列表中产生项目的排列。

让我们转移到另一个工作域以使示例更易于理解。该示例取自TowardsDataScience教程页面。

您有一家电子商务商店,您希望使用这种方式对您的产品进行排名,该方式将在搜索页面上进行排序并最大化您的收入。您拥有的功能是产品的属性,目标是访问者是否在该会话中购买。

然后你训练一个分类器(例如 LogisticRegression)并获得该类的预测概率作为排名。