我目前正在研究一种元建模器,以构建免费的 Web 服务,以便人们可以输入数据并在该数据上运行多个模型。
我目前正在努力的任务是:用户需要逐列输入数据,其中包括 n 个 ID、m 个属性和 k 个类,条件是 n、m > 0 和k >= 0。数据是异构的,因此索引可以是数字或文本,属性和类也是如此。为简单起见,我假设数据中不会有空值。
我目前正在考虑:
1)创建一个包含足够多的列(全部为空值)的表,这样我就可以只使用非空列(将从用户输入中获得)。然而,这将限制人们可以输入的数据集的大小。
2)诉诸于在编程语言上创建一个专门的数据结构,在那里完成所有的工作,最后,动态地创建一个表来存储结果数据。
3)使用专门用于此类数据的数据库(可能是基于文档的数据库)。
4)在RDBMS本身上创建一个数据结构(我使用的是PostgreSQL),假设是一个可变大小的数组,这样我就可以直接从用户输入创建表,只使用3个变量数组(一个用于索引,一个用于属性和一个用于类)。但是,我记住属性和索引可能是不同的类型,因此数组必须支持异构数据类型,我不知道这在 RDBMS 或 SQL 上是否可行。
我一直在寻找有关信息的信息,但直到现在都没有结果。任何对软件包、语言库、扩展或论文、论文、技术报告以及相关信息的指导将不胜感激。此外,做类似事情的个人经验可能会很有用。