我正在开发一个推荐系统,它应该为我的客户提供他们应该采取哪些行动来达到某些目标。
过程的基本机制是物理的——行动和结果都可以物理测量。
我目前的算法基于一个预测模型,可以预测给定动作的预期结果。可以对这个结果进行评分,因此对许多结果进行评分*可以导致找到最佳行动——将被推荐的行动。
*评分基于结果和目标之间的距离。
我的预测模型性能很好(低 MAE)。它的性能估计是基于预测已经采取的(历史)行动并将其预测与实际(历史)结果进行比较。
当我尝试估计推荐质量时,我的问题就出现了,因为许多推荐是没有采取的行动,我几乎没有办法评估它们的质量。
我尝试使用实际结果作为我的推荐系统的“目标”,并将推荐的操作与实际采取的操作进行比较。我不确定这是正确的方法,任何建议都将不胜感激。