针对非营利网站上的大型 CSV 文件的数据可视化解决方案的建议

数据挖掘 可视化 数据分析 CSV
2022-02-28 15:52:35

对于试图将大型 CSV 文件转换为有意义的信息的非营利组织,我希望得到您的建议和建议。

我是一家非营利组织的一员,该组织希望将 23,000 行 x 23 列的 CSV 文件转换为图表。CSV 文件由乔治亚州调查局每年发布数次,可在此处公开获取:http: //state.sor.gbi.ga.gov/SORT_PUBLIC/sor.csv

如您所见,CSV 包含超过 23,000 条个人记录,因此有必要按县对这些记录进行分组。保留趋势的存档数据会很好,但不是必需的。

该解决方案的目标是可视化佐治亚州 159 个县的每个县的数据以及整体可视化。我设想代表人口统计信息的饼图或圆环图,例如种族、性别和 CSV 收集的其他数据。我希望 159 个县中的每一个县都有自己的报告,然后是整个乔治亚州的整体报告。该解决方案需要嵌入我们的网站。它不需要实时跟踪数据,因为我可能会每季度上传一个新的 CSV。

我的网站正在运行带有 CiviCRM(PHP 7.3、MySQL 5.7)的 Wordpress CMS。我拥有对该站点的完全 root 访问权限,因此我可以在需要时安装 Web 应用程序。

有没有人有建议来完成这个?我目前正在研究 GoodData。我们是一家非营利组织,因此解决方案越实惠越好。我不介意安装开源解决方案以通过 SaaS 托管解决方案节省资金。

感谢您的建议。如果您需要,我很乐意提供更多信息。

1个回答

Shiny可能是一个有趣的选择:它是一个 R 库,允许程序员从 R 程序生成交互式网页。

  • 可以使用所有用于数据操作/可视化的 R 库(例如,用于图形的ggplot2库)
  • 交互式页面在程序员方面只需要很少的努力即可呈现
  • 非常灵活,允许非常复杂的可视化(请参阅图库),结果看起来非常专业恕我直言。
  • 它需要在站点上运行 Shiny 服务器,根据我的经验,它可以很容易地安装。据我所知,有一个商业版本,但免费版本没有任何重要的限制。

缺点:

  • 我不确定我会向没有任何 R 经验的人推荐这个,仅仅为了使用 Shiny 而学习这门语言可能是一个非常陡峭的学习曲线。
  • 它可能无法在大量流量下很好地扩展,具体取决于应用程序和内存资源。