背景:
我目前正在进行大量参数变化实验。它们使用 numpy 在 Python 2.6+ 中运行。这些实验将需要大约 2 周的时间来运行。
粗略地说,我在一系列值上改变了 3 个参数(自变量)。我正在修复 6 个进一步的自变量(目前)我正在报告 4 个因变量。
我改变的参数之一是分布在多个进程(和计算机)中。对于这些参数中的每一个,我都会生成一个单独的csv
文件,其中每一行都包含所有变量的值(包括独立变量、固定变量和相关变量)。在所有变体中,预计会生成大约 80,000 行数据
大多数时候,我只查看一个因变量的值,但我保留其他因变量的值,因为它们可以解释发生意外情况时发生的情况。
在这个实验的早期版本中,只改变了 2 个参数(每个参数只有 2 个值csv
) .在MS-Excel中做一些尴尬的事情让我按公式排序。这对于我拥有的 6 个实验结果集来说已经足够痛苦了。到本次运行结束时,我将获得 2 个数量级以上的结果。
问题:
我想一旦完成,我可以将csv
文件中的所有结果转储到数据库中,并查询出有趣的部分。然后将这些结果放入电子表格中进行分析。制作图表,查找相对于控制结果的得分等
我的想法是否正确?(这就是人们所做的吗?)
这些天我的数据库 foo 相当生锈,即使我使用 MS-Access 很好。我也打算为此使用 MS-Access。