概述
假设我有两个数据集,它们都由特征行及其匹配的标签组成。其中一个数据集是无噪声的,其标签对应于基本事实,但另一个已损坏,其部分标签被随机翻转。
问题
我们如何组合这些数据集并解释它们不同级别的噪声?据推测,我们不应该只丢弃有噪声的数据,但似乎我们也应该将其与更高质量的无噪声数据区别对待。
我们应该修改损失函数吗?我们应该如何构建训练/验证/测试集?我们应该分别训练两个模型,然后结合它们的预测吗?
我试图将问题形式化
让和分别是无噪声和有噪声的数据集。为简单起见,假设我们正在尝试学习确定性二元函数. 然后是一个例子或者是一个特征/标签对. 对所有人, 我们有. 但如果来自, 然后
在哪里是已知的。
我们如何结合和,以及我们如何考虑噪声参数?