数据挖掘 - 我关于 ML 模型的方法是否正确？ - 吾爱随笔录

首先，我是这里的新手，这是我在这个平台上的第一个问题，所以对于格式上的错误，如果有任何错误，我深表歉意。

在我的论文研究中，我试图通过查看商业航空参数来确定特定航班的飞机的非正常燃料消耗。为此，我使用了两个独立的数据库；一种是实际飞行数据（QAR 数据），另一种是高保真模拟（Operational Flight Plans）。我的策略是使用模拟 (OFP) 训练前馈 ML 模型（我使用 Pytorch），并使用 QAR 数据对其进行测试。以下是特定 ML 条件下的最佳模型结果。

最佳模特在这里

以上意味着，经过训练的模型可以在 %99.3 的航班中以小于 %5 的误差预测实际航班的燃油消耗。以同样的方式，错误<%3 --> %93.4 个航班，错误<%2 --> %78.9 个航班。

这就是我的困惑开始的地方。

比方说，%0.7 的航班少用或多用 %5 的燃料。我怎么能确定这不是由训练错误引起的？如果我用 OFP 参数测试模型并逐个飞行查看模型的错误并识别具有训练错误的飞行（即 %5 或多或少的燃料消耗），并将它们从第一个非正常识别过程中排除，会那工作？在我看来，这个想法是行不通的，因为训练数据集将与测试数据集相同，并且模型会过拟合。

您认为上述方法正确吗？是否有任何其他选择可以坚持以克服培训错误？还是我应该接受训练错误，因为在这种情况下对它们无能为力？