验证输出

数据挖掘 回归
2022-02-16 20:57:35

我正在尝试找到前 10 个有用的项目推荐。将项目分为类别,然后计算每个类别中的top10。有六个特征,根据这些特征为每个项目分配一个分数,然后按降序对它们进行排序以获得前 10 名。

我不确定这些是最好的顶级物品吗?如何验证输出?我需要看看哪个功能在计算分数时占主导地位?

我已经计算了相关性,还有其他统计方法吗?

1个回答

有很多方法可以查看推荐器的工作情况,我认为这实际上取决于您的最终目标。此处列出了评估指标列表,可能对查看有用。尽管像 Accuracy/Precision/RMSE 这样的度量可能适合您的需求。

为简单起见,假设您有一年的历史销售额。您可以根据前 8 个月的销售额构建系统,然后在接下来的每个月中,您都可以查看该月推荐的产品以及该月实际购买的产品。因此,您可以在其中了解它的表现如何(在某人购买的 5 种产品中,我们在前 10 名列表的第 1、2、6、8、9 位中拥有全部 5 种产品)。您希望产品购买更接近顶部,这就是排名指标对您有用的原因。

当然还有很多需要考虑的,但我认为这是一个很好的起点。您是想增加纯销售额还是增加收入?某些产品是否会根据季节/节假日销售更多?您是在使用评级还是仅关联销售(您如何推荐新产品?)。诸如此类的因素会改变您的推荐人以及您希望如何评估它。