我尝试过使用 BERT 进行多标签文本分类。
以下是示例输入:$15.00 小时,客户服务,对行业开放
其中一个标签是 Billing_rate,预测分数看起来相当不错。
现在我的问题是,我是否想从 BERT 中提取15.00 美元的基本特征值。你能建议我下一步的选择是什么吗?
我尝试过使用 BERT 进行多标签文本分类。
以下是示例输入:$15.00 小时,客户服务,对行业开放
其中一个标签是 Billing_rate,预测分数看起来相当不错。
现在我的问题是,我是否想从 BERT 中提取15.00 美元的基本特征值。你能建议我下一步的选择是什么吗?
您需要应用一个标记器,一个通用的 NE 标记器或一个经过定制训练的标记器。标记器将每个标记作为一个实例,以便您可以提取特定的标记序列,例如:
$15.00 Begin_Billing_rate
hour Billing_rate
customer _
service _
, _
open _
to _
industries _
当然,为了训练自定义标记器,您还必须逐个标记您的数据标记。