Spacy 使用其预定义的算法检测实体。它解析文本中的标记,考虑标记相对于它周围标记的位置。它还考虑了这些令牌的 POS 标记。
但是,我认为它错过了上面和下面的标记的位置(例如在表格数据中),或者它也错过了一些文本属性,比如它是否是下划线等。这个陈述是基于我的理解。如果我在这些方面错了,请纠正我。
现在的问题是,在对实体进行训练和预测时是否可以考虑这些属性?我见过扩展属性,但它们在训练和预测过程中不起作用,而是作为元数据工作。
Spacy 使用其预定义的算法检测实体。它解析文本中的标记,考虑标记相对于它周围标记的位置。它还考虑了这些令牌的 POS 标记。
但是,我认为它错过了上面和下面的标记的位置(例如在表格数据中),或者它也错过了一些文本属性,比如它是否是下划线等。这个陈述是基于我的理解。如果我在这些方面错了,请纠正我。
现在的问题是,在对实体进行训练和预测时是否可以考虑这些属性?我见过扩展属性,但它们在训练和预测过程中不起作用,而是作为元数据工作。