我在 CSV 文件中有日志评论列表。我想使用 K-Means 对这些日志评论进行聚类,之后我想将每个聚类评论转换为一般形式。 例如。我在一个集群中有一堆评论,从“预订编号失败......”开始,我想将这些评论转换为特定的评论,如“预订失败”。
我可以通过在查看每个集群后为每个集群指定特定名称来实现这一点。但我不想这样。我想创建智能模型,它会自动为我创建通用评论。
我不想为每个集群分配名称。基本上我完成了集群部分。也就是说,我可以说如下 3 个集群
- 集群 0 :“预订号失败......”等评论列表,总评论:15
- 集群 1:评论列表,如“请求超时失败,由于......”,评论总数:9
- 集群 2:“餐饮预订成功完成...”等评论列表,总评论:5
我想构建模型,通过其内容智能地为每个集群分配名称。例如。
- 集群 0 将获得名称为“预订失败”
- 集群 1 将获得名称为“请求超时失败”
- 集群 2 将获得名称为“餐饮预订成功”
如果在用一些不同的评论训练更多数据之后。它应该创建另一个集群并根据内容分配名称。