我是移动数据公司的实习生和统计学硕士候选人。我正在研究基于驾驶员驾驶习惯的驾驶分数。我们有包含距离、快速加速(秒)、快速停止、转向角度等的行程数据。我已经阅读了一些相关的文章和论文,但其中一些包含我无法处理的技能,例如基因编程。
我想知道哪些 ML 技能可以用于这个无监督学习问题(也许?)。下面是我们数据集的一个例子。
Driver ID | Trip time | Distance | Harsh acceleration | Quick Stop | ...
1 60 mins 1 mile 180 seconds 7 times ...
2 30 mins 0.3 mile 10 seconds 2 times ...
我的目标是根据每个驾驶员的数据集得出驾驶分数。规模无关紧要。它可以是 0-100 等级或分类器,例如差、差、正常、好、完美。我正在努力解决的问题是我必须创建目标值(驾驶分数)。我想无监督学习可能是一个提示,但我不太确定。我欢迎任何形式的建议或来源!非常感谢你。