BERT:文本分类和特征提取

数据挖掘 nlp 伯特
2022-02-27 09:26:56

我尝试过使用 BERT 进行多标签文本分类。

以下是示例输入:$15.00 小时,客户服务,对行业开放

其中一个标签是 Billing_rate,预测分数看起来相当不错。

现在我的问题是,我是否想从 BERT 中提取15.00 美元的基本特征值。你能建议我下一步的选择是什么吗?

1个回答

您需要应用一个标记器,一个通用的 NE 标记器或一个经过定制训练的标记器。标记器将每个标记作为一个实例,以便您可以提取特定的标记序列,例如:

$15.00     Begin_Billing_rate
hour       Billing_rate
customer   _
service    _
,          _
open       _
to         _
industries _

当然,为了训练自定义标记器,您还必须逐个标记您的数据标记。