是否有已知的技术可以将分类为 C 的特征 X 转换为分类为 C' 的特征 Y

数据挖掘 分类 聚类
2022-02-27 00:31:52

我不认为我的问题的措辞是我自己清楚的,但我没有更好的词适合标题(至少在我的头上)。我想知道是否给定由模型 M 归类为 C 类的特征 X,是否有办法找到与 X 相对“接近”的特征 Y,以便将其归类为 M 类 C'。

我在想某种聚类是否可以提供帮助,例如 k-means,然后获取 C' 类的质心并使用它。最后的想法是让 X 和 Y 之间的差异被显示出来。这听起来合理吗?我不是一个真正的数据科学家,所以想检查一下我的想法。

如果有人可以建议将不胜感激的论文或方向

编辑:为了澄清。这样做的目的是,我有一套人们的技能和他们的工作,我希望能够就一个人需要为他们想要的工作培养哪些技能提供建议。

例如,我可以编程,拥有计算机科学学位,在 unix 等方面有经验,并且被归类为软件开发人员(技能被编码为数值而不是文本),我想成为一名化学工程师。我想知道我需要的技能,以便我可以被归类为适合成为一名化学工程师。

所以 X 是我的技能集,C 是软件开发人员,C' 是化学工程师,Y 是适合我正在寻找的化学工程师的技能集。

2个回答

这个问题可以从经济学的角度来解决,即使有现有的数据并且没有复杂的算法。劳动经济学领域已有一些关于职业间技能转移的研究。比如这篇《职业技能可迁移性的估计方法》论文:https ://link.springer.com/article/10.1007/s12651-016-0216-y

它讨论了一种方法,参考了 Ormiston 在 2016 年发表的另一篇论文,这可能对您有所帮助。它涉及计算“跨职业共享的、标准化的知识、技能和能力类别的比率”。

以下是一些相关的摘录:

它“采用“技能”方法,明确估计职业 i 中使用的知识、技能和能力 (KSA) 的比例,这些知识、技能和能力 (KSA) 也可应用于职业 j。”

“为了估计这一比例,它使用来自美国劳工部职业数据库 O*NET 的数据来检查 120 个标准化知识、技能和能力维度中职业的共性。”

“O*NET 检查每个职业,并根据在该专业中发挥作用所需的熟练程度(0-7 级)以及每个组件对职业的重要性(1-5 级)来衡量每个组件;将这些值相乘会产生一个综合评分,Sim, 对于职业i的每个组成部分m。”

有一个公式给出

“根据三位数的职业代码估算 500 个职业的技能可转移性,然后通过在每个两位数类别中取算术平均值,将这些可转移性估算值汇总到 22 个两位数级别的职业中,以便与 Shaw 的技能可转移性进行比较。因此,本研究基于两位数的美国人口普查代码推导出了 22 × 22 的职业技能转移矩阵,代表了职业人力资本转移的估计比例。”

有一个例子:

数据表明,人力资源经理只能将其在当前职业中使用的 19.68 分中的 16.01 应用于工业工程师的新角色。然而,鉴于职业技能组合的差异,人力资源经理可以将他们在工程和技术(1.03 分)以及销售和营销(5.99)方面所需的所有知识应用于工业工程师的新职位。将职业 i 和 j (23.03) 之间的共享点数相加并除以职业 i (26.70) 的总点数,估计可转移率为 86.30 % (t ij = 0.863)。

您可以使用这些数据和方法来找出某人缺乏技能的领域,并根据这些发现提出建议。

据我了解,您对对抗训练技术感兴趣。 看看这个: https ://www.deeplearningbook.org/contents/regularization.html @7.13 Adversarial Training 和熊猫的图像示例。虽然这个概念是相反的,即它找出模型分类错误的现有分类区域附近和相似的点,但有时这些点接近相同,例如:第 265 页参考资料中的熊猫示例。