我正在使用自动编码器来检测保修数据中的异常情况。它是无人监督的。我通过模型计算重建误差,将具有高重建误差值的记录视为异常。我想知道,是否有必要对数据进行训练/测试拆分。
任何帮助深表感谢!
是的,这仍然是必要的,您正在根据该数据拟合您的模型并学习它以找到该样本的良好表示。验证这是否真的是异常情况要困难得多。