我不认为我的问题的措辞是我自己清楚的,但我没有更好的词适合标题(至少在我的头上)。我想知道是否给定由模型 M 归类为 C 类的特征 X,是否有办法找到与 X 相对“接近”的特征 Y,以便将其归类为 M 类 C'。
我在想某种聚类是否可以提供帮助,例如 k-means,然后获取 C' 类的质心并使用它。最后的想法是让 X 和 Y 之间的差异被显示出来。这听起来合理吗?我不是一个真正的数据科学家,所以想检查一下我的想法。
如果有人可以建议将不胜感激的论文或方向
编辑:为了澄清。这样做的目的是,我有一套人们的技能和他们的工作,我希望能够就一个人需要为他们想要的工作培养哪些技能提供建议。
例如,我可以编程,拥有计算机科学学位,在 unix 等方面有经验,并且被归类为软件开发人员(技能被编码为数值而不是文本),我想成为一名化学工程师。我想知道我需要的技能,以便我可以被归类为适合成为一名化学工程师。
所以 X 是我的技能集,C 是软件开发人员,C' 是化学工程师,Y 是适合我正在寻找的化学工程师的技能集。