假设我想建立一个接受一个输入并返回一个输出的神经网络回归模型。
这是训练数据:
0.1 => 0.1
0.2 => 0.2
0.1 => -0.1
您将看到有 2 个输入0.1
与不同的输出值匹配,0.1
并且-0.1
. 因此,大多数机器学习模型会发生什么,它们将预测0.1
输入模型的平均值。例如0.1
will 的输出是(0.1 + (-0.1))/2 = 0
.
但这0
作为一个平均答案是一个错误的答案。我希望模型告诉我输入不明确/不足以推断输出。理想情况下,模型会将其报告为一种信心形式。
如何从输入报告可预测性置信度?
我发现在许多领域都非常有用的应用程序是,我以后可以要求模型向我显示易于预测的输入和模棱两可的输入。这将使我能够收集有意义的数据。
我知道的一种方法是训练模型,然后检查每个训练数据的错误,如果它很高,则可能意味着输入不明确。但是,如果您知道任何其他论文或更好的技术,我将不胜感激!