我正在解决一个问题,其中我有一些关于一些发电机组的数据集。这些单元中的每一个都已被激活以在过去运行,并且在激活时,一些单元出现了一些问题。我现在拥有所有这些数据,我想为这些发电机组提出某种排名。排名的标准很简单。他们是:
- 特定发电机组被激活的最大次数
- 发电机组在激活过程中遇到了多少次问题
稍后我将通过添加更多标准来扩展此排名算法。我将使用 Apache Spark MLIB 库,并且我已经可以看到已经有很多算法。
http://spark.apache.org/docs/latest/mllib-guide.html
我只是不确定哪种算法适合我的目的。有什么建议么?