生物标记软件

数据挖掘 机器学习 主动学习
2022-03-10 15:32:33

我想用 BIO 标签标记字符数据,作为对未标记数据的主动学习过程的一部分。我假设有可用的开源 GUI 工具,我可以使用它来简化此操作 - 即显示要标记的字符串以及从预定义的一组标签中标记字符的某种方式(并且可能允许添加新标签)。

不过,我找不到任何东西——理想情况下是跨平台的(至少是 Linux 和 macOS)。它可以是云服务或 AWS 产品,但我更喜欢本地安装的东西。

有谁知道这样的事情?即使是像搜索词这样简单的东西也会有所帮助。

2个回答

另一个解决方案是doccano,但没有 prodigy 提供的主动学习支持它是开源的(免费),易于安装并支持各种应用程序,除了 NER(BIO 标记),还支持分类和翻译。

Prodigy是一个数据标注工具,我认为它在 NLP 任务中大放异彩。

我也听说过亚马逊机械土耳其人,我知道它可以用于注释,但它更通用。