使用决策树算法进行传感器故障检测是否可行?

数据挖掘 机器学习 决策树
2022-02-17 06:18:43

要点是我想使用机器学习算法在给定来自无线传感器网络的一些数据集的情况下将系统故障与传感器故障分开。

例如,如果我在给定区域有一些温度传感器以及它们在每种时间间隔中的相应读数,我想知道异常值是由于实际故障还是由于传感器故障引起的。当然,训练集将有这样的条目标记为传感器故障或系统故障是给定的。

我曾想过只使用线性回归之类的东西,但即使系统无法像那样建模,我也希望它能够工作。在我看来,决策树似乎是一个更合适的算法。

最后,还需要考虑训练和分类所花费的时间,因为我希望看看它是否可以用于对此类异常做出真正快速响应的系统。

抱歉,如果有点罗嗦,但我不确定我应该输入多少信息,因为这是我第一次发布(我什至不确定这是否是发布此内容的正确堆栈交换)。无论如何,提前感谢您的回答!

1个回答

您需要确定如何表述您的问题。我认为它有两个方面:1.检测异常值(温度)2.确定异常值是由于传感器还是系统问题

第一个是异常检测问题,有很多关于该主题的文献,包括基于树的传感器数据方法。一种突出的方法是隔离森林,它在 scikit-learn 中实现。http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.IsolationForest.html

二是故障定位。这个领域在文献中也得到了很好的描述,甚至在机器学习成为一件事之前就使用了基于树的模型。这里的一个关键是只训练异常数据,那么这应该成为一个相对简单的分类问题,假设你有相关的特征。