通过将每个训练实例复制到输入和输出来训练自动编码器。但是,在预测异常检测时,输出误差是否会出现在与异常输入相同的输出特征中,例如,如果我有 10 个特征,并且我预测特征 #4 的异常输入,那么高输出误差会是也仅限于输出功能#4,或者其他输出上会出现高错误?如果定位到特定特征,整个检测会变得更加有用。
自动编码器的异常输入特征是否会导致相应输出特征的高错误?
数据挖掘
深度学习
异常检测
自动编码器
2022-03-09 02:40:12
2个回答
输出错误将传播到后续层,因此如果您的自动编码器在所有特征上学习一个函数,则异常将在您用作输入的所有特征中交织。一个技巧是将特定特征(或特征集)映射到不同的自动编码器,并将它们作为一个整体进行训练。无论您是希望将特定特征异常集成到全局异常值分数中,还是保持特征子集的异常值分数,都是一种设计选择。有关一个好的用例,请参阅这篇最近的论文。
实验表明,输入和输出之间存在一些局部性,但是随着层数的增加,局部性会降低。据推测,随着每一层的增加,重建变得不那么局部化,因为误差在该层神经元的所有输出中共享,因此误差随着每个连续的输出层传播。最终结果是,在图像中,重建像素误差位于每个输入像素周围,但层数越多,误差在相关输入像素周围的分布范围就越广
其它你可能感兴趣的问题