需要:用于计算文本可读性/复杂性的 Java 库

数据挖掘 nlp 文本 爪哇
2022-02-17 18:28:20

原则上与此相同,但对于 Java(理想情况下适用于多种语言)(例如 flesch 阅读难度、烟雾指数、flesch kincaid 等级、coleman liau 指数、自动可读性指数、dale chall 可读性分数、linsear 写入公式、喷枪雾等) .

我想一定有很多库,但我就是找不到它们......

1个回答

我也找了这个,只找到了未维护的RAT库。

但基本上所有这些算法(大多数在本文中被描述为公式)都可以直接从单个 Python 文件中翻译出来,而无需额外的依赖。

一个例外是 Linsear Write 公式,因为它需要一种音节计数方法。但是,如果您使用CMU 发音词典或等效工具,您可以轻松构建该countSyllables方法,算法的其余部分是微不足道的。