音高检测和起始检测有什么区别?

信息处理 声音的 沥青 音乐
2022-01-30 05:07:01

根据维基百科发病检测:

开始是指音符或其他声音的开始,其中幅度从零上升到初始峰值。它与瞬态的概念相关(但不同):所有音符都有一个开始,但不一定包括初始瞬态。

和音高检测

音高检测算法 (PDA) 是一种算法,旨在估计准周期或虚拟周期信号的音高或基频,通常是语音或音符或音调的数字录音。这可以在时域或频域或两个域中完成。

这两个定义对我来说很清楚。Onset 试图找到音符的开始,音高检测试图检测基频。

出现了混淆,因为我认为这两个概念高度相关。例如,如果我想跟踪一个音符,这是否意味着我已经检测到音高?或者那个频率可能是谐波而不是基频?

有人可以解释两者是否有显着不同,或者只是同一概念的不同背景问题;跟踪特定频率与跟踪该频率何时开始。

2个回答

这两个概念与音乐的两个不同维度或方面有关,它们可能相关,也可能不相关。

开始检测涉及找到声音开始的时间点。这样做不需要事先了解声音的特定音高(或基频)。它可能确实依赖于在声音开始时能量增加的特性。实际上,您可以很好地对没有明确定义的音高的录音进行起始检测(例如:鼓声、机器噪音......)。

您可以将音高和起始/节奏视为与音乐的“垂直”和“水平”组织有关。存在沿着这两个维度的变化重合的材料类型,因此检测算法可以利用一个维度的变化来推断另一个维度发生了变化。但这种巧合/相关性是偶然的。

好的,您可以在不进行起始检测的情况下进行音高检测。这是肯定的。当您进行音高检测并且输入几乎没有声音或音高不佳时,通常音高检测器不会从最近的“好”音高值更新音高值。音调不佳的声音通常具有非常低的“周期性度量”,因为信号既不是周期性的也不是准周期性的。音高音符的音也将具有低周期性度量,并且该信息有时可用于起始检测。超过半音的音高突然变化也可用于起始检测。

因此,在典型的音频到 MIDI 方案中,首先进行音高检测,结果不仅仅是音高。除了音高之外,音高检测器的输出还将有一个幅度参数、一个周期性参数(有时称为“音高置信度”),可能还有一个音色参数(或几个音色参数)。一个好的起始检测器可能会利用所有 3 或 4 个参数并寻找变化“新奇”,并将以炼金术的方式组合这些参数,以最佳猜测是否以及何时发病。

还检查这样的出版物这个音高的变化绝对是关于音符开始的提示。我只是同意 pichenettes 的原始答案,即他们彼此没有任何关系(甚至很少)。如果您正在哼一首曲子,音高的变化可能是您听到的唯一物理参数的变化,以提示您有一个新音符。