我有兴趣实现一个自然语言处理程序(又名ELIZA)。
假设我已经存储了单词及其强度之间的语义-词汇连接。
处理具有非常不同含义的单词的方法是什么?
几个例子:
“我们在同一页上吗?”
在这种情况下,“页面”不是文档页面,而是短语的一部分。
“我住在雷丁。”
“阅读”是一个城市(名词),所以它不是动词。否则没有任何意义。检查大写字母在该特定示例中有效,但不适用于其他示例(例如“make”可以是动词或名词)。
“我在 Facebook 墙上读到了一些东西,你想知道什么吗?”
“Facebook 墙”与墙完全无关。
一般来说,算法应该如何区分词义并识别上下文中的词?
例如:
- 检测不同类型语音的单词,因此它应该识别它是动词还是名词。
- 检测单词是否是短语的一部分。
- 检测多个含义的单词。
为了通过上下文识别单词的正确含义,有哪些可能的方法来解决该问题?