为了进行实验,我们希望使用嵌入在许多推文中的表情符号作为基本事实/训练数据,以进行简单的定量情绪分析。推文通常过于非结构化,以至于 NLP 无法正常工作。
无论如何,Unicode 6.0 中有 722 个 Emoji,可能 Unicode 7.0 中还会添加另外 250 个。
是否有包含情绪注释的数据库(例如 SentiWordNet)?
(请注意,SentiWordNet 也确实允许模棱两可的含义。考虑例如funny,这不仅仅是积极的:“这味道很有趣”可能不是积极的......;-)
例如同样适用。但我不认为这更难表情符号比普通单词...)
此外,如果您有使用它们进行情绪分析的经验,我很想听听。