数据挖掘 - 改进 CoreNLP POS 标注器和 NER 标注器？ - 吾爱随笔录

CoreNLP 部分语音标注器和名称实体识别标注器开箱即用，但我想进一步提高准确性，以便整个程序运行得更好。为了解释更多关于准确性的信息——在某些情况下，POS/NER 被错误地标记了。例如：

而不是 VB* 或类似的东西，因为它是一个类似动词的短语（我不是语言学家，所以对此持保留态度）。

那么实现精度提高的最佳方法是什么？