当您运行主题建模(例如 LDA)时,您可以获得一些主题的输出以及相应的关键字及其权重。根据我的理解,人们通常会为每个主题输出前 10 个或前 20 个关键字。对于这些关键字,它们还具有权重,表示每个关键字对某个主题的重要性。
例如,如果我决定为每个主题绘制前 10 个关键字,那么示例输出将如下所示。
topic 0: 0.2*keyword1 + 0.15*keyword2 + 0.09*keyword3 +... + 0.005*keyword10
topic 1: ...
...
topic n
我不确定每个主题最多可以提取多少个关键字,但是每个主题的这些权重加起来是 1 吗?