数据挖掘 - 标记音频的工具 - 吾爱随笔录

标记音频的工具

数据挖掘时间序列标签音频识别

2021-09-28 17:22:44

我有几千个音频信号要标记为 2 个不同的类，并将它们保存到 numpy 数组中以进一步训练模型。MATLAB 最近发布Signal Labeler了他们的Signal Analyzer，这可能有助于标记时间序列，但由于某些原因，我不能使用它。

是否有任何特定的工具可以分析和标记 Python 的时间序列？不必将数据和标签保存到 numpy 数组中，.csv格式或任何类似的东西也是合适的。

将不胜感激任何帮助！

3个回答

Audacity是一款免费的开源音频编辑软件，适用于所有常见的桌面操作系统。它可以用于注释音频，通过使用标签轨道。您可以在某个位置放置标签，或覆盖选定的时间。

注释

打开或将您的音频导入 Audacity
选择要注释的音轨。
Click Track-> Edit-> Labels->Edit Labels添加一个新的标签轨道
选择要在轨道中注释的位置
使用键盘快捷键插入新标签Ctrl + B

重复直到完成轨道。

导出注释

使用导出标签File -> Export -> Export Labels

加载注释

要将标签加载到 Python 中，您可以使用以下代码片段：

import pandas

path = 'PATH/TO/FILE'
labels = pandas.read_csv(path, sep='\t', header=None,
                        names=['start', 'end', 'annotation'],
                        dtype=dict(start=float,end=float,annotation=str))

试试这个：https://labelstud.io，它是一个通过网络浏览器的免费开源工具，具有良好的文档和大量示例。容易上手。

或者，如果您需要团队合作，您可以使用标签平台：https ://heartex.ai 。

您可以尝试以下方法：

音频注释器

用于注释和标记音频文件的 JavaScript 接口。

音频标签机

使用 Docker 和 Flask 随机标记音频剪辑的浏览器内应用程序。[![在此处输入图像描述][4]]

回声机器学习

播放、可视化和注释您的音频文件

峰值.js

由 BBC UK 开发的基于浏览器的音频波形可视化和 UI 组件，用于与音频波形交互。

wavesurfer.js

简单的注释工具，查看示例。

[![在此处输入图片描述][10]]

其它你可能感兴趣的问题

上一篇为什么 Scikit 和 statsmodel 提供不同的确定系数？下一篇Keras 是一个花哨的工具，还是它实际上对研究有帮助，或者两者兼而有之？