机器学习工人性能特征,可将任务最佳分配给工人

数据挖掘 机器学习 预测建模 优化
2022-03-07 08:22:07

假设我们在一家公司有一个英语到法语的翻译任务,并且有 100 多名工人精通这项任务,但每个工人都有自己独特的属性,使他们能够以比其他人更好的方式完成某些翻译(例如,作为医生的翻译会更好地翻译医疗文件)。考虑每天收到 1000 份要翻译的文件,每份文件需要一天的时间来翻译。所以,有两个问题:

  1. 使用排队模型或任何其他有效的分配机制将任务分配给可用的翻译。
  2. 使用机器学习系统根据每个人的过去表现(例如,正确性分数、静态参数如技能、资格、经验等)来学习工人模型。

是否有一种设置/系统/模型可以在一个内聚系统中解决上述两个问题?根据我的阅读,这个问题需要分配问题、用户建模、排队和机器学习优化的应用。我正在寻找整合所有这些的现有模型或框架,谁能给我一些最佳分配任务的方向?

1个回答

你的问题有很多方向。

如果您知道工人的属性,例如医生、工程师或会计师,您可以进行镜像文档分类,并使用机器学习进行分类。

如果要衡量性能,则需要从每个用户那里获取样本。例如,取顶部14性能并为用户提供目标向量。将文档映射到用户的强度。如果该用户排队过多,请选择下一个最高的14等等。你可以使用余弦相似度给你一个分数。这可能会变得很棘手,因为您可能希望将生产力标准化。您可能会得到一个高生产力用户更擅长的文档,但低生产力用户可以。打个比方,美式足球运动员可能是最好的接球手和中卫,但你可能有一个好的替补接球手而没有一个好的替补中卫,所以你让你的替补接球手。

静态参数会有所不同,如果您有性能度量,我不确定您是否应该使用它们。我的猜测是在你为工人表演之前排队。但即使在 4 个文档中,您也可以选择一个顶部14.

您还可以创建集群并衡量用户与集群的性能。这是最简单的排队方法,因为您只需将下一个文档从作为用户最佳集群的集群中取出。您只需要几个跨集群工作人员来调整队列。缺点是,如果您有 20 个集群,则需要一段时间才能获得用户性能与集群相比,因此您需要使用静态属性,直到获得有效采样。