在我的大多数项目中,我提出了模型并希望可视化某些属性如何作为参数子集的函数而变化,, .. ETC。
所以我经常会得到看起来像这样的“参数扫描”的数字
这些对于解释模型/流程/数据集非常有帮助。
问题是:我投入了大量的工作来生成生成这些数字所需的数据。其中大部分浪费在管道本身上。我经常需要耦合 2 到 10 个不匹配的程序,处理数千个中间文件,一路跟踪文件名中的参数等等。这很快导致 bash 脚本不堪重负。
考虑到参数扫描,是否有任何原则性的方法来管理不匹配程序的管道?说一个 python 模块,用户可以在其中声明包装器以及它们如何交互。那么用户只是在参数空间的每个点上“启动管道”并以易于使用的格式数组恢复数据?
