我有电子邮件文本,其中还包含免责声明、电话号码、电子邮件地址、文件附件名称、地址、问候语等。
目前,我盲目地通过一个名为Vader的 OOTB 情绪分析器传递此文本,但结果不佳(即,如果我打开一封标记为负面的电子邮件,我的人类理解并不能确认情绪 - 查看核心英文文本)。
我可以使用正则表达式等去除电子邮件地址、文件名等,但其他文本组件(例如地址、免责声明)更难删除。顺便说一句,免责声明通常是负面的......
无论如何,我想知道是否有人知道我的场景的文本准备方法 - 提取核心人类文本。谷歌搜索取得了一定的成功。谢谢!