用“回归分析”代替“监督机器学习”,你会发现你的问题很难回答。根据您定义回归分析的范围,DOE 可能是该术语的一部分。
假设您计划使用回归分析来确定某种除草剂在田间的效率。第一步是设计实验。在这种情况下,我认为 DOE 与您的回归分析密不可分,它是其中的一部分。
在 ML 的许多应用中,您都获得了数据,并且无法对计划实验做太多事情,事实上,没有实验。例如,在 Kaggle 比赛中,一切通常都是预先设置好的,训练数据集是预先定义并给出的,测试数据集将在评估阶段给出,而你不能对这些事情做任何事情。这就是为什么在该领域没有大量提及 DOE 的原因。
但是,它不必是这种方式。假设您正在制造自动驾驶汽车。是的,像往常一样,您可以使用所有可用的数据集来训练您的 ML 视觉组件,所有带有交通标志和道路状况的图像,以及很好的标记等。这里真的不涉及 DOE。然而,一旦你走出初始阶段并进入现场测试,情况就会发生变化。DOE 解决的所有典型问题都出现了,例如,您需要 10 辆测试车还是 1,000 辆才能获得可靠的结果?在真正的街道上试用测试车之前,您是否需要在空旷的道路上行驶 1,000 英里或 1,000,000 英里?等等
ML 可能不一定将他们为规划开发所做的事情称为 DOE,但本质上它是 DOE。因此,您的问题的答案在于您定义 ML 术语的狭义或广义。它只是使用成本(损失)将函数拟合到数据吗?或者它是构建替代人类的可靠机器的更一般定义,这不仅包括拟合/优化,还包括 DOE 的某些方面。