稀疏表的数据录入工具

机器算法验证 r 数据集
2022-03-23 18:18:52

请为单个大型稀疏表建议一个数据输入工具(如果存在)。

就像是...

第 x 行,300 列的复选框列表,检查相关的 5,输入这 5 的数据。

第 x+1 行,相同的复选框,检查相关的不同 14,输入这 14 的数据。

第 x+2 行,复选框不包含列,添加列标题和数据类型,检查创建的新列和其他 33 个相关,输入这 34 个的数据。

尽管有可能,但在工作表中做起来很不方便——太多的标签/箭头。

2个回答

+1 的问题。我没有在网上大量搜索现有工具(大概是您在此处发布问题之前做过),但我猜有人必须创建一个 GUI 才能提交您想要的数据。

不过,您需要考虑要在分析的其他地方使用哪种格式,因为您可能希望在代码中使用稀疏格式,但在查看数据或手动修改元素时将数据作为传统的 2D 矩阵进行交互。这个问题用 R 标记,但从问题本身并不清楚你是如何使用 R 的。如果这需要是 R,那么忽略剩下的......

如果我必须自己创建这个功能,我会在 Python 中使用一些库来完成

  • 使用formlayout创建一个 GUI ,只需很少的代码即可获取数据行/列条目
  • 使用scipypandas获取用户提交并以各种稀疏格式存储它们,这也让您可以轻松地在稀疏和密集格式之间来回切换。
  • 使用tablib(或 pandas 数据框的内置方法)将数据写入 Excel 或其他“表格数据”文件格式。如果您想以编程方式读取/写入/格式化 Excel,请考虑使用pytoolswin32com
  • 如果您在交互式会话中处理数据,Spyder IDE提供了一个很棒的“变量浏览器”GUI,您可以使用它来手动修改密集查看但实际上稀疏格式数据的元素。

因此,希望有人为您发布准备就绪的解决方案,但我认为您(或您认识的人)创建您需要的东西不会非常耗时或困难。

祝你好运!

为“CATI”(计算机辅助电话采访)设计的软件通常非常适合基于键盘的快速数据输入。CfMC ”就是一个例子。

您可以在 CATI 类型的数据收集程序中设计此问题的方式是设置一个具有 300 个选项的多选问题。数据输入操作员将看到一个列出所有 300 个选项的屏幕,并且可以使用数字键盘一次输入一个数字。例如,他们会打 12、122、150、264、299,然后继续。

对于 300 个选项中的每一个,都会有一个后续问题,取决于它是否在第一个问题中被选中。因此,如果他们在第一个问题上选择了五个选项,他们将依次收到 5 个后续屏幕,并为这些列输入值。从那里很容易将该稀疏表转换为您喜欢的任何格式。