数据挖掘 - 机器学习工人性能特征，可将任务最佳分配给工人 - 吾爱随笔录

机器学习工人性能特征，可将任务最佳分配给工人

数据挖掘机器学习预测建模优化

2022-03-07 08:22:07

假设我们在一家公司有一个英语到法语的翻译任务，并且有 100 多名工人精通这项任务，但每个工人都有自己独特的属性，使他们能够以比其他人更好的方式完成某些翻译（例如，作为医生的翻译会更好地翻译医疗文件）。考虑每天收到 1000 份要翻译的文件，每份文件需要一天的时间来翻译。所以，有两个问题：

使用排队模型或任何其他有效的分配机制将任务分配给可用的翻译。
使用机器学习系统根据每个人的过去表现（例如，正确性分数、静态参数如技能、资格、经验等）来学习工人模型。

是否有一种设置/系统/模型可以在一个内聚系统中解决上述两个问题？根据我的阅读，这个问题需要分配问题、用户建模、排队和机器学习优化的应用。我正在寻找整合所有这些的现有模型或框架，谁能给我一些最佳分配任务的方向？

1个回答

你的问题有很多方向。

如果您知道工人的属性，例如医生、工程师或会计师，您可以进行镜像文档分类，并使用机器学习进行分类。

如果要衡量性能，则需要从每个用户那里获取样本。例如，取顶部 $\frac{1}{4}$ 性能并为用户提供目标向量。将文档映射到用户的强度。如果该用户排队过多，请选择下一个最高的 $\frac{1}{4}$ 等等。你可以使用余弦相似度给你一个分数。这可能会变得很棘手，因为您可能希望将生产力标准化。您可能会得到一个高生产力用户更擅长的文档，但低生产力用户可以。打个比方，美式足球运动员可能是最好的接球手和中卫，但你可能有一个好的替补接球手而没有一个好的替补中卫，所以你让你的替补接球手。

静态参数会有所不同，如果您有性能度量，我不确定您是否应该使用它们。我的猜测是在你为工人表演之前排队。但即使在 4 个文档中，您也可以选择一个顶部 $\frac{1}{4}$ .

您还可以创建集群并衡量用户与集群的性能。这是最简单的排队方法，因为您只需将下一个文档从作为用户最佳集群的集群中取出。您只需要几个跨集群工作人员来调整队列。缺点是，如果您有 20 个集群，则需要一段时间才能获得用户性能与集群相比，因此您需要使用静态属性，直到获得有效采样。

其它你可能感兴趣的问题

上一篇R：只替换整个语句（而不是它们的一部分）下一篇如何测试总体显着性？