我正在从事一个关于 NBA 数据的数据挖掘项目。我想制作一个类似于 google 的推荐系统,您可以在其中搜索玩家并获得类似玩家的推荐。我打算根据他们的统计数据制作这样的系统。我的数据看起来像这样
14 Tony Allen 709 357 15386 2178 4580 0.476 102 363 0.281 2076 4217 0.492 0.487 1220 1701 0.717 804 1567 2371 942 995 299 964 1675 5678
15 Al-Farouq Aminu 431 228 9988 1119 2592 0.432 188 607 0.31 931 1985 0.469 0.468 530 731 0.725 618 1724 2342 488 413 245 540 813 2956
我想到的一种方法是使用 k-means 聚类,但我不确定如何使用这些聚类来找到相似的玩家。每个集群将有数百名玩家,我需要进一步过滤。
有人对处理这个问题有任何建议/技巧吗?