我有三个标签:有趣、冷静和精力充沛。我得到了这样的词组: Set1 = {Cloud Sky People in nature Plant Flash Photography Happy Shorts Grass Leisure Recreation} Set2 = {Plant Green Natural Landscape Natural Environment Branch Tree People in Nature Shade Wood Deciduous} 我想对这组词进行分类进入其中一个标签。你们有什么感想?Set1 应标记为精力充沛,Set2 应标记为平静。
如何将一组单词分类为一个给定的标签
数据挖掘
分类
nlp
2022-02-23 12:19:04
1个回答
可能有很多变体,但这里有两个简单的方法:
- 使用预训练的词嵌入,您可以计算两个词之间的语义相似度。例如,您可以使用余弦来测量目标词(例如“calm”)的向量与集合中的每个词(例如“cloud”)之间的相似度。然后集合中单词的平均值给出了该集合与目标的关联程度,您可以选择具有最大相似度的目标。
- 使用WordNet直接获得单词之间的语义距离/相似度。方法与上述类似。
请注意,可以对这些基本概念进行许多改进,例如,您可以使用一组与“平静”相关的预定义词,而不仅仅是“平静”一词(例如,您可以从 WordNet 中获得最相似的词)。也有许多选项可用于跨词集的聚合。
其它你可能感兴趣的问题