哪种可视化技术最能描述推荐数据集?

数据挖掘 可视化 javascript
2021-10-01 02:06:48

我编写了一个简单的推荐器,它根据用户点击的内容为用户生成推荐。推荐器生成如下格式的数据文件:

userid,userid,simmilarity (between 0 and 1 - closer to 0 the more similar the users)
a,b,.2
a,c,.3
a,d,.4
a,e,.1
e,b,.3
e,c,.5
e,d,.8

我查看了一些图表,但我不确定要使用哪一个,或者是否还有其他图表可以更好地显示上述数据集中的用户相似性。有什么建议?

我的目标是针对完全不是技术的业务用户进行这种可视化。我只想向他们展示一个易于理解的视觉效果,详细说明某些用户的相似程度,从而让企业相信推荐系统对这些用户有用。

@Steve Kalestad 你的意思是这样的:

在此处输入图像描述

2个回答

我认为您正在寻找相似度矩阵(见页面底部)。如果您没有某些对之间的相似性数据,您始终可以将它们保留为灰色或白色。此外,这仅适用于足够小的数据集以实际了解正在发生的事情。我会说最多 25 行/列。

在相似度矩阵中,x 和 y 坐标对应于您要比较的两个事物,而颜色图大小表示相似度

编辑:替换颜色图可以做的一件事是根据相似度度量插入不同大小的圆圈。或者,您可以再次插入数字本身,随着数字大小的变化而改变数字的大小。尺寸通常效果最好的是业务可视化。

就个人而言,我认为 Netflix 做对了。将其分解为 1-5 的置信度等级,并根据黄星的数量显示您的建议。

它不一定是星星,但这些基于图标的图表很容易解释并清楚地传达要点。