我是 NLP 新手。我有几个 100 个文本句子(数据框中的 100 行),一个句子的平均字长为 10。我想知道使用 NLP 技术可以得出哪些有趣的见解(从简单描述到高级)。我不打算预测任何事情,而是分析并获得一些有趣的见解。
我已经想到了可以使用我拥有的示例数据完成的以下项目。
统计句子中每个单词出现的次数,最后找出我拥有的句子列表中最常用(顶部)的单词和最少使用(底部)的单词
使用 NER 查找每个句子中的实体。在我的句子中,哪个实体被讨论得最多?
使用文本相似度指标查找哪些句子相似。
我可以识别句子的情绪
LDA 可以用来识别句子的主题(平均有 10 个单词)而我的数据集本身只有 100 个句子吗?
你认为创建句法/依赖树有什么用?我们能从中推断出什么?这可能对语言学家有用,但它可以帮助外行的最终用户/业务人员获得一些见解吗?关于该主题的任何简单解释或将我引导至资源都会有所帮助
我认为我们无法总结它,因为我的句子平均只包含 10 个单词
你能帮我解决 q5、q6 和 q7 的问题吗?
你认为还有什么可以做的吗?你认为还有什么可以做的。