可视化电影/演员关系

机器算法验证 数据可视化
2022-04-03 03:16:20

首先,我是一名程序员,但我在真正统计方面的经验在 A-Level 结束,所以我希望你们所有人帮助我完成一个我一直在修补的小项目。

在家里,我使用 Plex Media Center 来显示我所有的电影。我为此构建了一个导出工具来生成一个包含您图书馆信息的 HTML 文件,以便其他人可以在线查看它。在我制作了这个工具之后,我意识到我现在可以访问关于电影和其中演员的大量数据。这就是你们(和女孩)希望进来的地方。

我想以某种方式形象化演员和电影之间的关系。最初我只是使用一个节点图形库将所有参与过不止一部电影的演员映射到他们所有的电影中,结果如下:http ://www.flickr.com/photos/dachande663/5574979625/ [a section of a 5000x2500 像素图像]

问题是,如果有超过 250 部电影,它就会变成一团无法理解的意大利面条。我研究过弧形图,但认为它会更加混乱。

因此,我的问题是:我如何可视化这一点?尺寸并不是什么大问题,因为我很想把它打印在一张大画布上然后挂起来。此外,我最终将用相应电影和演员的图像替换文本。我要避免的是到处都有一百万行蜿蜒曲折。我试图找到最重要的电影并将它们放在更中心的位置,但目前这更多的是猜测而不是实际逻辑。

是否有库可以做得更好,甚至可以更好地显示数据(将参与者作为节点删除并将它们添加为边缘标签)?我目前正在使用 Dracula 图表,它提供了一个好的起点,但可以根据需要进行更改。

任何输入将不胜感激。干杯。

4个回答

注意这是以前的(长)评论,我已将其转换为答案。希望我能够在一两天内发布我在下面描述的示例。

为什么不尝试像热图这样的东西呢?将电影作为行,将演员作为列。也许根据电影中演员的数量和每个演员参加过的电影数量对它们中的每一个进行排序。然后为每个匹配的单元格着色。这基本上是邻接矩阵的可视化。建议的排序应该制作一些有趣的图案,正确使用颜色可以使其既艺术又更具信息性。可能是电影类型或 Netflix 评级或男女演员(或观众!)的比例等颜色。

结帐 Gephi,这个软件有一些非常好的布局算法来处理意大利面问题:http ://gephi.org/features/

特别是,试试ForceAtlas布局: http: //forum.gephi.org/viewtopic.php ?f=26&t=926 该软件让您可以实时控制参数,您可以手动移动节点。

(免责声明:我是这个社区的一员)

Graphviz 可以优化布局,在这里看到类似的东西