我正在开发一个信息提取器,专门用于解析电影、导演和演员等实体之间的关系。NLTK 似乎为构建这样一个系统提供了必要的工具。然而,目前尚不清楚如何添加自定义标签(例如演员、导演、电影名称)。
同样,NLTK Book 的第 7 章讨论了使用命名实体识别器进行信息提取,但它掩盖了标签细节。
所以,我有两个问题:
如何添加自定义标签?如果我有相关命名实体(例如电影、演员等)的裸列表,我如何将它们作为特征包含在内?看来我需要使用 IOB 格式,但是当我只有命名实体列表时,我不确定如何执行此操作。
我正在开发一个信息提取器,专门用于解析电影、导演和演员等实体之间的关系。NLTK 似乎为构建这样一个系统提供了必要的工具。然而,目前尚不清楚如何添加自定义标签(例如演员、导演、电影名称)。
同样,NLTK Book 的第 7 章讨论了使用命名实体识别器进行信息提取,但它掩盖了标签细节。
所以,我有两个问题:
如何添加自定义标签?如果我有相关命名实体(例如电影、演员等)的裸列表,我如何将它们作为特征包含在内?看来我需要使用 IOB 格式,但是当我只有命名实体列表时,我不确定如何执行此操作。