标记音频的工具

数据挖掘 时间序列 标签 音频识别
2021-09-28 17:22:44

我有几千个音频信号要标记为 2 个不同的类,并将它们保存到 numpy 数组中以进一步训练模型。MATLAB 最近发布Signal Labeler了他们的Signal Analyzer,这可能有助于标记时间序列,但由于某些原因,我不能使用它。

是否有任何特定的工具可以分析和标记 Python 的时间序列?不必将数据和标签保存到 numpy 数组中,.csv格式或任何类似的东西也是合适的。

将不胜感激任何帮助!

3个回答

Audacity是一款免费的开源音频编辑软件,适用于所有常见的桌面操作系统。它可以用于注释音频,通过使用标签轨道。您可以在某个位置放置标签,或覆盖选定的时间。

注释

  1. 打开或将您的音频导入 Audacity
  2. 选择要注释的音轨。
  3. Click Track-> Edit-> Labels->Edit Labels添加一个新的标签轨道
  4. 选择要在轨道中注释的位置
  5. 使用键盘快捷键插入新标签Ctrl + B

重复直到完成轨道。

大胆与标签轨道

导出注释

使用导出标签File -> Export -> Export Labels

加载注释

要将标签加载到 Python 中,您可以使用以下代码片段:

import pandas

path = 'PATH/TO/FILE'
labels = pandas.read_csv(path, sep='\t', header=None,
                        names=['start', 'end', 'annotation'],
                        dtype=dict(start=float,end=float,annotation=str))

试试这个:https://labelstud.io,它是一个通过网络浏览器的免费开源工具,具有良好的文档和大量示例。容易上手。

在此处输入图像描述

或者,如果您需要团队合作,您可以使用标签平台:https ://heartex.ai 。

您可以尝试以下方法:

  1. 音频注释器

用于注释和标记音频文件的 JavaScript 接口。

在此处输入图像描述

  1. 音频标签机

使用 Docker 和 Flask 随机标记音频剪辑的浏览器内应用程序。[![在此处输入图像描述][4]]

  1. 回声机器学习

播放、可视化和注释您的音频文件

在此处输入图像描述

  1. 峰值.js

由 BBC UK 开发的基于浏览器的音频波形可视化和 UI 组件,用于与音频波形交互。

在此处输入图像描述

  1. wavesurfer.js

简单的注释工具,查看示例。

[![在此处输入图片描述][10]]