数据挖掘 - 自动编码器的异常输入特征是否会导致相应输出特征的高错误？ - 吾爱随笔录

自动编码器的异常输入特征是否会导致相应输出特征的高错误？

数据挖掘深度学习异常检测自动编码器

2022-03-09 02:40:12

通过将每个训练实例复制到输入和输出来训练自动编码器。但是，在预测异常检测时，输出误差是否会出现在与异常输入相同的输出特征中，例如，如果我有 10 个特征，并且我预测特征 #4 的异常输入，那么高输出误差会是也仅限于输出功能#4，或者其他输出上会出现高错误？如果定位到特定特征，整个检测会变得更加有用。

2个回答

输出错误将传播到后续层，因此如果您的自动编码器在所有特征上学习一个函数，则异常将在您用作输入的所有特征中交织。一个技巧是将特定特征（或特征集）映射到不同的自动编码器，并将它们作为一个整体进行训练。无论您是希望将特定特征异常集成到全局异常值分数中，还是保持特征子集的异常值分数，都是一种设计选择。有关一个好的用例，请参阅这篇最近的论文。

实验表明，输入和输出之间存在一些局部性，但是随着层数的增加，局部性会降低。据推测，随着每一层的增加，重建变得不那么局部化，因为误差在该层神经元的所有输出中共享，因此误差随着每个连续的输出层传播。最终结果是，在图像中，重建像素误差位于每个输入像素周围，但层数越多，误差在相关输入像素周围的分布范围就越广

其它你可能感兴趣的问题

上一篇错误长度 > 1 并且只使用第一个元素？下一篇如何在 Keras 中保存整个数据的预测值