我对我的数据运行了不同的主题建模方法(其临床数据与认知障碍疾病相关。我们将处理哪些重要的事情使其发展为更严重的疾病)。在此之前,我将我的数据划分为不同的 6 个月数据(从起点每 6 个月返回一次),然后每 6 个月运行一次主题建模方法。我将看到每 6 个月的派生主题之间的差异。
例如,前六个月有 20 个主题,然后后六个月有 20 个主题,然后……直到第十个(5 年)。我希望看到一个不同的主题,因为我每六个月或至少每 1 年都有一个用例。但可悲的是,大多数单词每 6 个月重复一次。但是,单词的数量发生了变化。
例如,在前六个月,“睡觉”这个词在不同的主题中重复了 10 次,但在第二个 6 个月中,它已经重复了 4 次。
我要说的是,如果我们将此视为时间很重要的事情,除非我依靠每六个月变化的单词数量,否则我无法在我的数据中看到任何明显的模式。
您认为分析我的输出并在不同的 6 个月内绘制不同的字数是否有意义?或者它的东西不可靠。
另外,你介意让我知道我可以应用哪些其他方法来从我的主题建模的输出中获得洞察力(请考虑每六个月的变化很重要)?