用复数表示真实世界的音频信号是否有意义?

信息处理 离散信号 声音的 复杂的
2022-01-15 23:09:07

本课程(Coursera:音乐应用的音频信号处理)中,教授使用了一个获得复杂正弦曲线的 DFT 的示例:

x2[n]=eȷ(2πf0n+φ)forn=0,,N1X2[k]=n=0N1x2[n]eȷ2πkn/N=n=0N1eȷ(2πf0n+φ)eȷ2πkn/N=eȷφn=0N1eȷ2π(k/Nf0)n=eȷφ1eȷ2π(k/Nf0)N1eȷ2π(k/Nf0),

其中频率表示为并且它具有初始相位。f0

  • 所以看起来真实世界的(离散的)音频信号在以数字方式表示时可能具有复杂的值,但这有意义吗?

  • 如果是,那么我们该如何解释呢?

  • 输入的值不应该代表气压的变化吗?

  • 因此,如果对于输入信号,假设,那么这将告诉我们当时隔膜上的压力是什么?xx[0]2+3ȷ

4个回答

所以看起来真实世界的(离散的)音频信号在以数字方式表示时可能具有复杂的值,

不,你误会了。离散音频时间信号没有非实数值。傅里叶变换可以有这样的。

但这有意义吗?

它不需要有意义这只是数学。我有时会提醒自己——偶尔远离人类对事物赋予意义的渴望是有帮助的。

但是,假设任何信号都具有傅里叶变换,并且该变换是纯实数。现在你将该信号及时移动通过了解傅里叶变换属性,或者仅应用积分(连续 FT)或总和(离散 FT),您会立即看到这意味着与相乘。在一般情况下,这会产生以前没有的非零虚部。S(f)Δtej2πΔtf

换句话说:即使您有一个 FT 是纯实数的信号,只需将其时间移动一点,您总能得到频谱中的非零虚部。这适用于所有信号,无论是音频还是无线电接收器的 I/Q 基带。

如果是,那么我们该如何解释呢?

我认为你继续听这些讲座是有道理的,我不想剧透太多,但是:

只有时间对称(准确地说是时间厄米特,但由于音频信号是真实的,这与对称性相同)信号具有真实频谱。如果您看到非实频谱,您可以简单地判断该信号不是厄米(对称)信号。

此外,它还告诉您,如果要处理信号的频谱,则始终必须同时考虑幅度和相位来表示信号。这两个方面都不能单独在频谱的实部上定义!第一个是实部和虚部的平方和的根(所以虚部很重要),第二个是虚部和实部之比的反正切。顺便说一句,相位“包含”谐波信号的时移,在整个信号周期中测量,这是对音频非常重要的一类信号。

输入的值不应该代表气压的变化吗?

是的。但那是时域信号,不是频域信号。

因此,如果对于输入信号 x,假设 x[0] 为 2 + 3j,这将告诉我们关于该时间点隔膜上的压力?

您将实时时域信号与其傅里叶变换混淆了一个单一的标量值,如瞬时气压,是真实的。没有在时域中不可能。但是,在频域中,可能存在虚部。+3j

确保您理解这一点:

信号只是随时间或其他轴而变化的值。因此,最直观的表示是沿该轴的表示,例如,音频信号可能是压力随时间的变化。

但是,还有其他表达相同信号的方式。信号的傅立叶变换描述了相同的信号,但与时间信号是不同的函数。我们常说“频域”(FT之后)和“时域”。

我不知道你的背景,但在我学习的早期,我们学习了向量空间基变换

“时间步长”只是描述信号的基础之一;“傅立叶系数”是另一个。关于这两个基相同的信号具有不同的系数(即表示为数字的向量) 。离散 FT 真的,真的,真的只是一个普通的、陈旧的、无聊的基础变换矩阵,具有一些不错的属性!

另一种看待它的方式是,复数值只是在某些物理行为期间表现出(足够接近)某种关系的两个实数值,这种关系是两个实数值以足够相似的方式一起变化,以至于它们可以当将这些实数输入值对视为单个复数值时,可以通过使用复数乘法和加法的公式进行建模。

这两个真实值可能是“瞬时”气压和速度,在某些情况下,可以将它们的配对行为建模为一个复数值,因此在教科书或黑板上需要更少的方程行。

您正在谈论信号的傅里叶变换。转换是与您开始时不同的域。您同样可以问用颜色编码的环表示阻力是否有意义。

感觉并没有发挥作用。问题是表示是否捕获了相关信息,以及域的变化是否具有抵消变化努力的优势。

是的,您需要复数。但坦率地说:尝试改用 Hartley 变换(将实函数转换为实函数),您会发现算法复杂性增加,而其描述能力下降,而描述能力是我们首先开始变换的原因. 在实值计算方面,Hartley 变换往往比傅里叶变换减少一些操作。但是与仅在复杂领域中工作相比,索引和描述变得更加棘手。所以他们从来没有变得过于时尚。

有时,为信号、函数添加维度,使它们和关联的结果更通用,更实用。想想多项式:如果你坚持实根,它们的数量可能会有很大差异。次多项式都具有恰好个根(包括多个根)。dd

以更普通的方式,我认为使用复数(在某些条件下)将对象(实数)连同它的影子(虚部)一起考虑。虽然阴影可以从太阳位置恢复,但将物体及其阴影合在一起会让你忘记太阳。以余弦信号为例。将其幅度视为最大值听起来很自然。但是您可以很容易地看到余弦的绝对幅度在之间变化,尽管在道德上它“应该”是 1。添加余弦的(分析)阴影,即正弦(它们被称为希尔伯特对)。你得到,其幅度(模数)始终为101eix1,简单多了。因此,从真实的音频输入,您可以使用物理属性构建有意义的复杂信号。例如,在地震中,波的极化很重要。变得复杂可能很有用。但出于实际原因,可以从左/右对构建复杂的音频信号。

所以:

  • 这有意义吗?三重是,复合体可以揭示信号的真实性质
  • 如果是,那么我们该如何解释呢?作为指导和帮助
  • 输入的值不应该代表气压的变化吗?输入仍然是真实的,或者可能只是真实的部分,或者更多的东西。可能是压力加上它的假想阴影。傅里叶变换的输出可能很复杂,没什么大不了的
  • 因此,如果对于输入信号,假设,那么这将告诉我们关于那个时间点隔膜上的压力?您可能会在这里进入一片混乱的境地:您可能正在谈论碰巧对于真实信号,总是真实的,它代表信号的平均值。但是其他一些可能很复杂。他们的相位可以告诉你关于你的信号的有趣细节,通常不是在特定的时间索引,在整个区间范围内xx[0]2+3ȷX[0]X[0]X[n]