时间序列数据的交互式标签/注释
更新:我们更新了 TRAINSET 以包括上传多个系列以及应用多个标签的能力!请参阅下面的 GIF 演示。
我们在 Geocene 一次又一次遇到同样的问题,所以我们想出了这个名为 TRAINSET 的开源网络应用程序。您可以使用 TRAINSET 将标签刷到时间序列数据上。您以定义的 CSV 格式导入数据,然后标记数据,然后导出标记的 CSV。如果您真的只是想优化标签,也可以导入预先标记的 CSV。您可以在https://trainset.geocene.com上使用 TRAINSET 的托管版本,也可以按照https://github.com/geocene/trainset上的自述文件自行部署
我目前正在开发一组工具来注释和检测时间序列数据中的模式:https ://github.com/avenix/WDK
检查 1-Annotation 中的 AnnotationApp
我也需要这样一个工具来注释数据但没有找到任何合适的工具。因此,我自己编写了一个小型 python 应用程序,只是滥用了 matplotlib 来完成这项任务。
我将matplotlib.use('TkAgg')和SpanSelector与我自己的onselect(xmin, xmax)方法一起用于此任务。检查此代码示例:https ://matplotlib.org/gallery/widgets/span_selector.html
参加聚会有点晚了,但总比没有好。我们发布了名为 Label Studio 的时间序列数据标记工具的主要版本更新。
现在它支持可变数量的通道,每个通道都有数百万个数据点,具有缩放/平移、区域标签和实例(单个事件)标签。
它适用于不同的时间序列数据类型,例如,时间可能是浮点数或格式奇怪的日期,具有多用户支持和多标签分类。
商业版请访问https://heartex.ai ,开源请访问 https://labelstud.io/(现在需要手动编译)