潜在语义分析和显式语义分析有什么区别

数据挖掘 相似
2021-10-15 13:52:19

我不太确定在这种情况下“潜在”指的是什么。

使用基于维基百科的显式语义分析计算语义相关性中,他们说

''Our semantic analysis is explicit in the sense that we manipulate 
 manifest concepts grounded in human cognition, rather than 
 'latent concepts' used by Latent Semantic Analysis''.

简单来说这是什么意思?

我查看了相关的 Wikipedia 文章(Latent(wikipedia.org/wiki/Latent_semantic_analysis)、wikipedia.org/wiki/Explicit_semantic_analysis Explicit)),但我无法对它做出正面或反面。

也许对这里所涉及的细微差别有更好理解的人可能能够为我提供一个明确的指示,说明这两种访问文档/文本片段与特定概念相关性的方法之间的异同、优缺点。

1个回答

不同之处在于,在 ESA 中,概念是已知的并已标记(因此,“清单概念”),而在 LSA 中,概念是潜在的(它们是未定义的,需要被发现)。

请注意ESA Wikipedia 页面中的以下声明

The name "explicit semantic analysis" contrasts with latent semantic analysis (LSA), because the use of a knowledge base makes it possible to assign human-readable labels to the concepts that make up the vector space.[3][1]

简而言之,ESA 使用单词和概念之间关系的先验知识(以及这些概念的标签),而 LSA 没有。

维基百科引用的上述引用的参考资料: [1] Ofer Egozi, Shaul Markovitch and Evgeniy Gabrilovich (2011). "Concept-Based Information Retrieval using Explicit Semantic Analysis" (PDF). ACM Transactions on Information Systems 29 (2). Retrieved January 3, 2015. [3] Gabrilovich, Evgeniy; Markovitch, Shaul (2007). Computing semantic relatedness using Wikipedia-based Explicit Semantic Analysis (PDF). Proc. 20th Int'l Joint Conf. on Artificial Intelligence (IJCAI). pp. 1606–1611.