使用哪种类型的机器学习

数据挖掘 机器学习 神经网络
2022-03-06 13:23:29

我们正在处理一个复杂的应用程序,即实验室中的物理测量,它有大约 230 个不同的输入参数,其中许多是范围或多值。

该应用程序产生一个输出,然后在外部(物理)过程中进行验证。在过程结束时,各个测试被标记为“成功”或“失败”。也就是说,尽管有许多输入参数,但输出是以布尔方式评估的。

当测试失败时,参数会稍微“放松”并重新测试。

我们的数据库中有大约 20,000 个条目,有“成功”和“失败”两种情况,我们正在考虑使用机器学习应用程序在两个方面提供帮助:

1) 最佳参数的初始选择
2) 在“失败”后如何调整参数的建议

许多输入参数彼此密切相关。

我在 90 年代中期学习计算机科学,当时的重点主要是专家系统和神经网络。我们还可以访问一些免费的 Microsoft Azure 机器学习 CPU 小时。

哪种机器学习适合这些用例?

1个回答

使用 R,您可以查看树/随机森林。由于您有相关变量,您可以查看投影追踪分类树(R 包 pptree)。很快就会有一个 ppforest 包。但这仍在开发中。您还可以将 randomforest 与包 forestFloor 结合使用,以查看 randomforest 的曲率并从那里开始工作。