我有一个关于声音音高校正物理学的问题。
我的背景是物理学,我主要活跃在physics.stackexchange 上。(查看我的个人资料。)
我的问题的背景:
在计算机录音之前,只有模拟录音。假设您是一名歌手,并且您录制了钢琴伴奏,但您想以较低的音调进行排练。一些录音带播放器具有可调节的磁带速度。调整磁带速度意味着音乐的音高和音乐的节奏同步变化。
我的理解是:随着计算机录音的出现:开发了具有独立改变音高和速度能力的软件。因此,可以在不改变速度的情况下改变音高,或者在不改变音高的情况下改变速度,或者是音高和速度的不同变化的所需组合。
鉴于我的物理背景(知道声音是如何叠加许多频率的),我对可以独立改变音高和速度的软件的存在感到困惑。我知道它存在,我使用过它,但我什至无法开始猜测它是如何实现的。
关于在电脑屏幕上查看波形:
几年前,我将音乐从一堆黑胶唱片复制到 CD。一些唱片有严重的划痕,在损坏的位置每转一圈都会造成 10 或 20 次响亮的爆裂声。现在有软件可以自动过滤掉这样的pop,但是我当时用的软件没有。所以我所做的是:我会一直放大到那个尖峰,有时我可以复制一个相邻的部分,只需几毫秒,然后用它来替换该持续时间的损坏部分。我永远无法让它无缝,粘贴的行为总是会留下一些神器。那个神器几乎听不见,所以没关系,但我永远无法让它无缝。
我提供这些信息是为了让你知道你可以在什么级别回答这个问题。
音高校正是如何实现的?它必须是一个与操作模拟录音时改变音高的方式完全不同的过程。
我认为这不可能是一个将音乐剪切并重新组合的过程;我的假设是这会产生大量的人工制品。
回应答案和评论。
在某些方面,我的期望已在答案中得到证实。原始版本必须在非常抽象的层面上进行解构和重新合成。重建/再合成水平的要求之一是高保真音高检测,但在现实世界中,音高在哪个八度音程中可能是不明确的。
我的印象是:当涉及到音高校正时,没有入门级的理解可以让你 90% 的进入,而只有 10% 的错误。
我的印象是:在理解音高校正算法时,从一开始就是深入探讨。