我是数据科学的新手,并且一直在进行研究以熟悉自己并尝试找到解决问题的方法,但我没有遇到任何似乎合适的东西。我正在寻找学习和使用 Python 来完成这个过程。
我的情况如下:我正在测试的汽车有多个错误日志。每次出现错误(有多种类型)时,我都有一个日志,其中包含错误发生时汽车的许多不同特征。这些包括一天中的时间、速度、位置、温度等等。编辑:如果需要,我也可以拥有正常操作的数据。
我的目标是在特征中找到与错误相关并可能导致错误的模式。我不打算开发一个可以预测未来错误的模型。我只专注于查看模式本身并理解它们,当我们再次遇到错误时,我提供的数据越多,它就会变得越准确。
例如,我想为一种错误提供我所有的数据,并让它告诉我一些类似“当速度高于 x 时,你可能会得到这个错误”、“当汽车倒车并以晚上您可能会收到此错误”、“外部温度与此错误之间没有相关性”等。然后针对每种类型的错误继续执行此操作。
一些变量可能相互依赖。一些变量可能不相关/没有意义。
我怎样才能在 Python 中做到这一点?任何指导表示赞赏。我试图尽可能具体,如果需要更多详细信息,我会更新我的帖子。