创建鞋码推荐系统

机器算法验证 数理统计
2022-03-24 14:12:58

(对不起,如果我对这个问题进行了错误分类或命名。)

假设您有来自不同鞋品牌的一群人的鞋码数据。因此,一个人可能拥有 Nike = 11、Reebok = 10.5、Adidas = 11、Converse = 11.5 等等。您可以定义一个矩阵,其中代表第个个体,代表他们在第个品牌中的大小。Mijiijj

然后假设您有一个人知道他们的耐克尺码是 9,并且想知道他们最可能的阿迪达斯尺码(或者他们可能知道多个品牌的尺码,但不知道阿迪达斯)。预测他们的阿迪达斯尺码的最佳方法是什么?

一个简单的方法可能是查看耐克和阿迪达斯之间每个人的体型差异(对于每个),然后取最常见的差异和将其添加到该人的耐克尺码以获取他们的阿迪达斯尺码。例如,如果大多数人在从耐克到阿迪达斯时选择了一半的尺码,那么这个人最可能的阿迪达斯尺码是 9.5。Mi,j=NikeMi,j=Adidasi

但是有没有更复杂的方法?例如,也许有些人的脚很奇怪,而且他们的尺码在所有品牌中的关系并不适合大多数其他人。是否有一些自然的方法可以使这些人的数据的权重低于其他人的数据,你愿意这样做吗?

我有一种感觉,这是一个普遍的问题,例如这些天在线上根据消费者数据提出建议的任何东西。

1个回答

取决于你愿意对鞋子的尺码做出什么样的假设。例如,我认为可以肯定地假设 9 到 10 号 Redwings Iron Ranger 之间的差异类似于 10 号和 11 号阿迪达斯桑巴之间的差异。如果 9 IR 穿着 10 Samba,那么我们就知道 10IR 会穿着 11 Samba。

这还取决于您是否有关于个人内多只鞋子的信息,在这种情况下,您将通过重复测量获得更多信息。假设你没有,你可以简单地取每个鞋组内尺寸的平均值,并在假设人们不拥有不合脚的鞋的情况下比较组间的平均差异。

如果您确实进行了多次测量,则可以通过拟合混合效应模型来获得更精确的建议,该模型将对个体效应进行平均,并估计每只鞋的尺码之间的分类个体差异。

E[Size|Brand,Individual]=β0,i+β1,bBrand

SPSS、R、SAS 和统计软件可以适合这些,但不是您的普通 Excel。

值得注意的是,鞋子通常既宽又长,因此您可以考虑问一个更精致的问题,即如何根据据称是长/宽的合身度来推荐某人购买一双鞋。