通过示波器的音色与声音

信息处理 声音 模数 基频
2022-02-08 10:50:29

我的理解是,不同的声音会产生相同幅度和频率的波,但大多数事物(如人的声音、乐器等)会同时产生多个不同的“声音”(波)。

我的理解是,由执行此操作的事物(例如人声)产生的基波称为基波,而产生的所有其他“次级”声波/信号称为谐波并且这组波作为一个整体(基波和任何伴随的谐波)被称为音色

因此,我的理解是,我们用耳朵听到的“声音”实际上是发出声音的事物的音色(某种类型的基波聚合/组合加上产生的任何其他谐波)。

因此,首先,如果我的上述理解不正确或被误导,请从纠正我开始!假设我的理解或多或少是正确的......

这段使用数字示波器的视频中,您可以看到(大约 0:40 秒)当作者说话时,只产生一个波。然而,鉴于我将“声音”理解为音色,我希望看到屏幕上显示多个波(一个用于基波,其他用于相应的谐波)。

我的问题:这个示波器是否显示了作者的“音色”波(某种类型的聚合或组合他的声音的基波加上任何伴随的谐波)?或者它是否以某种方式过滤掉谐波并只显示他的基波?还是我对声波的理解天生就有缺陷?

1个回答

对不起,你的理解大多是错误的。

  1. 声音是流体介质(即空气)中的压力和速度波。
  2. 人类说话者会在他们周围产生一个 3 维声场。每个位置的声压和粒子速度将不同。
  3. 麦克风测量一个位置的“声音”。根据麦克风的类型,它可以拾取压力、粒子速度或两者的混合。让我们保持声压以保持简单。
  4. 麦克风将本地声压转换为电压。那就是您在视频中的示波器上看到的信号。
  5. 人类语音由不同类型的声音组成。主要有三种类型
  6. 有声的声音。这些是具有可听音高的声音。这包括元音和鼻音,例如“nnnn”、“mmm”等。您可以“唱歌”或“哼”来制作旋律的所有内容。它们可以根据您的需要。
  7. 擦音:这些没有任何音高,更像是噪音。例如“ssss”、“ffff”、“shshsh”等。它们可以根据您的需要设置。
  8. 爆破音:这些声音很短,只有一个尖峰。“p”、“k”、“t”等

您对基本+谐波的整个概念仅适用于“浊音”,即具有音高的事物。这些确实可以通过基波和谐波来建模,例如,谐波的位置决定了元音是“aaaa”还是“eee”。

您在示波器上看到的是基波和谐波(以及其他一切:噪音、混响、空调等)的总和。从技术上讲,这不是一个波浪,而是一个信号。

从物理上讲:波是在空间和时间上传播的东西。麦克风已经解析了空间,因为它仅在一个位置对声波进行采样,并且对空间的依赖性消失了。虽然它还在空气中,但它是一种波,但一旦它被麦克风拾取,它就只是一个信号。这部分只是“语义”,许多人仍然称其为“波形”,因为它是从波中派生的信号。

编辑:回答评论中的问题

(1) 你说的是粒子速度;我的理解是声音在空气中以 343 m/s 的速度传播。您是说这不是一个常数,并且不同的波/信号会产生以不同速度传播的声音(假设空气是流体介质)?

不。粒子速度和波传播速度是不同的东西。粒子速度只是空气分子来回摆动的速度。强度越高,它们摆动得越多,速度就越高。波的传播速度是恒定的,不随强度变化。它是介质的可压缩性和密度的函数。

(2)我的理解是音高是波/信号的频率;

不,音高被感知。如果人类能够分辨某物是“高”还是“低”,它就有音高。对于正弦波和周期信号等信号,音调与信号的周期高度相关。其他信号没有可辨别的音高。

摩擦音和爆破音(它们是声音)不会也有振幅和频率,因此,音高?

不,它们没有音高,因为它们没有足够的周期性。

(3) 这里“基波”和“谐波”的正确定义是什么?

任何周期信号都可以表示为基频整数倍的正弦波之和。这就是傅立叶级数背后的整个概念。

(4) 当你说“你在示波器上看到的是基波和谐波的总和......”你会怎么称呼这个信号?它有什么特别的名字吗?

并不真地。这只是一个信号。

(5) 不管这个信号的名称是什么,我对你在这里使用“sum”这个词很感兴趣;它是所有其他事物的“总和”。同样,我本来希望每个不同的“声音”在屏幕上形成自己的信号。您是否有机会详细说明所有这些事情如何“汇总”成一个信号?

我认为你有它倒退。声音信号就是这样:空气分子来回摆动,麦克风检测压力是否上下波动。基本和谐波(等)的概念可用于分析信号或将其分解为不同的分量,但这不是它生成或传播的方式。它更像是一种数学工具,可以更轻松地进行预测和分析。