在本课程(Coursera:音乐应用的音频信号处理)中,教授使用了一个获得复杂正弦曲线的 DFT 的示例:
其中频率表示为并且它具有初始相位。
所以看起来真实世界的(离散的)音频信号在以数字方式表示时可能具有复杂的值,但这有意义吗?
如果是,那么我们该如何解释呢?
输入的值不应该代表气压的变化吗?
因此,如果对于输入信号,假设为,那么这将告诉我们当时隔膜上的压力是什么?
在本课程(Coursera:音乐应用的音频信号处理)中,教授使用了一个获得复杂正弦曲线的 DFT 的示例:
其中频率表示为并且它具有初始相位。
所以看起来真实世界的(离散的)音频信号在以数字方式表示时可能具有复杂的值,但这有意义吗?
如果是,那么我们该如何解释呢?
输入的值不应该代表气压的变化吗?
因此,如果对于输入信号,假设为,那么这将告诉我们当时隔膜上的压力是什么?
所以看起来真实世界的(离散的)音频信号在以数字方式表示时可能具有复杂的值,
不,你误会了。离散音频时间信号没有非实数值。傅里叶变换可以有这样的。
但这有意义吗?
它不需要有意义。这只是数学。我有时会提醒自己——偶尔远离人类对事物赋予意义的渴望是有帮助的。
但是,假设任何信号都具有傅里叶变换,并且该变换是纯实数。现在你将该信号及时移动。通过了解傅里叶变换属性,或者仅应用积分(连续 FT)或总和(离散 FT),您会立即看到这意味着与相乘。在一般情况下,这会产生以前没有的非零虚部。
换句话说:即使您有一个 FT 是纯实数的信号,只需将其时间移动一点,您总能得到频谱中的非零虚部。这适用于所有信号,无论是音频还是无线电接收器的 I/Q 基带。
如果是,那么我们该如何解释呢?
我认为你继续听这些讲座是有道理的,我不想剧透太多,但是:
只有时间对称(准确地说是时间厄米特,但由于音频信号是真实的,这与对称性相同)信号具有真实频谱。如果您看到非实频谱,您可以简单地判断该信号不是厄米(对称)信号。
此外,它还告诉您,如果要处理信号的频谱,则始终必须同时考虑幅度和相位来表示信号。这两个方面都不能单独在频谱的实部上定义!第一个是实部和虚部的平方和的根(所以虚部很重要),第二个是虚部和实部之比的反正切。顺便说一句,相位“包含”谐波信号的时移,在整个信号周期中测量,这是对音频非常重要的一类信号。
输入的值不应该代表气压的变化吗?
是的。但那是时域信号,不是频域信号。
因此,如果对于输入信号 x,假设 x[0] 为 2 + 3j,这将告诉我们关于该时间点隔膜上的压力?
您将实时时域信号与其傅里叶变换混淆了。一个单一的标量值,如瞬时气压,是真实的。没有;在时域中不可能。但是,在频域中,可能存在虚部。
确保您理解这一点:
信号只是随时间或其他轴而变化的值。因此,最直观的表示是沿该轴的表示,例如,音频信号可能是压力随时间的变化。
但是,还有其他表达相同信号的方式。信号的傅立叶变换描述了相同的信号,但与时间信号是不同的函数。我们常说“频域”(FT之后)和“时域”。
我不知道你的背景,但在我学习的早期,我们学习了向量空间、基和基变换。
“时间步长”只是描述信号的基础之一;“傅立叶系数”是另一个。关于这两个基,相同的信号具有不同的系数(即表示为数字的向量) 。离散 FT 真的,真的,真的只是一个普通的、陈旧的、无聊的基础变换矩阵,具有一些不错的属性!
另一种看待它的方式是,复数值只是在某些物理行为期间表现出(足够接近)某种关系的两个实数值,这种关系是两个实数值以足够相似的方式一起变化,以至于它们可以当将这些实数输入值对视为单个复数值时,可以通过使用复数乘法和加法的公式进行建模。
这两个真实值可能是“瞬时”气压和速度,在某些情况下,可以将它们的配对行为建模为一个复数值,因此在教科书或黑板上需要更少的方程行。
您正在谈论信号的傅里叶变换。转换是与您开始时不同的域。您同样可以问用颜色编码的环表示阻力是否有意义。
感觉并没有发挥作用。问题是表示是否捕获了相关信息,以及域的变化是否具有抵消变化努力的优势。
是的,您需要复数。但坦率地说:尝试改用 Hartley 变换(将实函数转换为实函数),您会发现算法复杂性增加,而其描述能力下降,而描述能力是我们首先开始变换的原因. 在实值计算方面,Hartley 变换往往比傅里叶变换减少一些操作。但是与仅在复杂领域中工作相比,索引和描述变得更加棘手。所以他们从来没有变得过于时尚。
有时,为信号、函数添加维度,使它们和关联的结果更通用,更实用。想想多项式:如果你坚持实根,它们的数量可能会有很大差异。次多项式都具有恰好个根(包括多个根)。
以更普通的方式,我认为使用复数(在某些条件下)将对象(实数)连同它的影子(虚部)一起考虑。虽然阴影可以从太阳位置恢复,但将物体及其阴影合在一起会让你忘记太阳。以余弦信号为例。将其幅度视为最大值听起来很自然。但是您可以很容易地看到余弦的绝对幅度在和之间变化,尽管在道德上它“应该”是 1。添加余弦的(分析)阴影,即正弦(它们被称为希尔伯特对)。你得到,其幅度(模数)始终为,简单多了。因此,从真实的音频输入,您可以使用物理属性构建有意义的复杂信号。例如,在地震中,波的极化很重要。变得复杂可能很有用。但出于实际原因,可以从左/右对构建复杂的音频信号。
所以: