首先,我是一名程序员,但我在真正统计方面的经验在 A-Level 结束,所以我希望你们所有人帮助我完成一个我一直在修补的小项目。
在家里,我使用 Plex Media Center 来显示我所有的电影。我为此构建了一个导出工具来生成一个包含您图书馆信息的 HTML 文件,以便其他人可以在线查看它。在我制作了这个工具之后,我意识到我现在可以访问关于电影和其中演员的大量数据。这就是你们(和女孩)希望进来的地方。
我想以某种方式形象化演员和电影之间的关系。最初我只是使用一个节点图形库将所有参与过不止一部电影的演员映射到他们所有的电影中,结果如下:http ://www.flickr.com/photos/dachande663/5574979625/ [a section of a 5000x2500 像素图像]
问题是,如果有超过 250 部电影,它就会变成一团无法理解的意大利面条。我研究过弧形图,但认为它会更加混乱。
因此,我的问题是:我如何可视化这一点?尺寸并不是什么大问题,因为我很想把它打印在一张大画布上然后挂起来。此外,我最终将用相应电影和演员的图像替换文本。我要避免的是到处都有一百万行蜿蜒曲折。我试图找到最重要的电影并将它们放在更中心的位置,但目前这更多的是猜测而不是实际逻辑。
是否有库可以做得更好,甚至可以更好地显示数据(将参与者作为节点删除并将它们添加为边缘标签)?我目前正在使用 Dracula 图表,它提供了一个好的起点,但可以根据需要进行更改。
任何输入将不胜感激。干杯。