作为作业的一部分,我必须编写一个遗传编程算法来预测大气污染物水平。由于我没有经验,任何人都可以向我指出将编写进化程序的编程语言的命题。
澄清:我不是在问我将用什么语言编写遗传算法本身(因为我将能够自己做出决定),我是在问应该用哪种编程语言创建进化程序。
我的导师建议使用 Lisp,但我不喜欢这个想法 --- 首先我必须研究某种抽象语法树,其次在树结构上可靠地进行交叉可能会一团糟。
我宁愿使用专门用于基因编程的东西,比如slash/A。SlashA 不需要处理 AST——字节码中的程序只是一个 int 数组,可以以任何必要的方式更改,因为每个 int 数组都代表一些 slash/A 程序。
补充说明:
- 我想避免操纵 AST!
- 这个问题很难(可能没有预测股票价值那么难)。这是因为(很可能)我们没有足够的输入信息(有一些隐藏参数)。创建一个比返回均值的模型具有更好性能的模型有点挑战(平均模型有 35% MAPE),大多数模型的 MAPE 约为 25%,最好有 20%。
- 我想要一种语言来管理具有许多功能的数据集,假设我不确定哪些是重要的。(斜线/A 在这里有一个缺点——在这种语言中,输入特征是按顺序读取的——所以某些特征会以更大的概率被使用)。
- 我希望能够在 Python 中对此进行编程,因此 python 库会很棒 --- 但我可以为 C/C++ 进行绑定(没有 Java,没有 Matlab 等)。
我知道这是一个调查问题,所以如果这个问题太早了,请关闭它,但我觉得它已经足够具体了。