使用 Spacy 的 NER 训练值的含义

数据挖掘 Python 斯派西
2022-02-15 10:53:11

我正在尝试使用 Spacy 训练自定义实体。在训练过程中,我得到了 LOSS、分数等值的数量。这些值的含义是什么

============================= Training pipeline =============================
ℹ Pipeline: ['tok2vec', 'ner']
ℹ Initial learn rate: 0.001
E    #       LOSS TOK2VEC  LOSS NER  ENTS_F  ENTS_P  ENTS_R  SCORE 
---  ------  ------------  --------  ------  ------  ------  ------
  0       0          0.00    278.46    0.00    0.00    0.00    0.00
 20     200       3647.33  10920.67   91.75   93.68   89.90    0.92
 40     400         92.82    679.78   98.21   99.48   96.97    0.98
 60     600         66.59    274.91   98.98  100.00   97.98    0.99
 80     800         87.59    252.62   98.98   99.49   98.48    0.99
1个回答

LOSS TOK2VEC的值LOSS NER是管道中令牌到向量和命名实体识别步骤的损失值。ENTS_F和列表示命名实体任务的 F 分数ENTS_PENTS_R精度和召回率的值(另请参阅此链接上“准确性评估”块下的项目。分数列显示管道的总体分数,这可能会或可能不会对特定子任务更重要。