我正在开发一个应用程序来帮助人们学习英语作为第二语言。我已经验证了句子通过提供额外的上下文来帮助学习一门语言。我通过在一个有 60 名学生的教室里进行一项小型研究来做到这一点。
我从 Wikipedia 中挖掘了超过十万句各种英语单词(包括 Barrons 的 800 个单词和 1000 个最常见的英语单词)
完整数据可在https://buildmyvocab.in获得
为了保持内容的质量,我过滤掉了超过 160 个字符的句子,因为它们可能难以理解。
作为下一步,我希望能够自动按照易于理解的顺序对这些内容进行排序。我自己是一个非英语母语人士。我想知道我可以使用哪些功能来区分简单句子和困难句子。
另外,你觉得这可能吗?