傅里叶变换的定性解释

信息处理 fft 理论
2022-01-14 22:47:37

我正在阅读M.Muller的《音乐处理基础知识》一书,我已经接近理解将信号分解为基本频率背后的想法,并且希望能在我的理解中弥补一些巨大差距。

对于某个频率$ω$的连续函数$f(t)$的傅立叶变换是根据与信号“最佳匹配”的该频率的正弦曲线来定义的。至关重要的是,这涉及选择使正弦曲线尽可能接近信号$f(t)$的最佳相移$φ_ω$,如下图所示(情况 b 比 a 好得多) 相移对拟合紧密度的影响

这本书在数学上量化了信号和正弦曲线的相似性,采用它们的内积积分,其中包括相位角作为优化参数

$$d_ω := \max_{φ \in [0,1)} \int_t f(t) \cos(2\pi(ωt-φ))dt \tag 1$$

到目前为止一切都很清楚,但是当他继续给出傅里叶变换的定义时,我们在切换到复数、极坐标和欧拉公式以及定义某些变换的等效方程后不知何故失去了优化$ω$变成

$$\hat{f}(ω) = \int_t f(t) e^{-2\pi iωt}dt \tag 2$$

那么究竟我们是如何失去优化的,以及由这个积分计算的复数如何确保选择最佳相移$φ$

我是一名具有一定数学倾向的计算机程序员,所以如果可能的话,我会很感激定性的解释。我对确切的证明不感兴趣

4个回答

定性解释的底线:傅立叶变换是我们的任意信号$x(t)$与所有频率的相关性,每个频率以复指数形式给出:$e^{j\omega t}$(这是大小为 $1$和角度$\omega t$的旋转相量)。这适用于$x(t)$就像在 OP 的案例中一样真实或复杂。相关计算的一般形式(我们在信号处理中的很多地方看到:匹配滤波器接收器、维特比解码,是的傅里叶变换!)是复共轭积的积分(或离散信号中积的总和) ,并且这样的计算在存在白平稳噪声的情况下将具有最小的噪声。下面将对此进行更详细的解释,希望能提供更直观的理解。这种相关性将在存在白噪声的情况下最大化每个$\omega$的频率和相位估计(但在存在其他噪声类型的情况下可能不一定提供最佳估计)。

详细信息:实际上,一旦$e^{j\omega t}$ 的形式之谜得到解决,我发现用正弦和余弦描述的傅里叶变换更加繁琐,而用指数表示的表达式非常直观

以下是一些主要内容:

首先,表达式$Ke^{j\phi}$只是具有实数$K$和实角$\phi$的复相量可能并不明显。所以$Ke^{j\phi} = K\angle\phi$

接下来,同样重要的是,将单个傅里叶频率音调视为单个旋转相量,而不是正弦曲线,以恒定速率和恒定幅度旋转。在我看来,这实际上会使一切变得容易得多。类似于自行车车轮旋转,其中频率是它的旋转速率,以每秒周期数为单位;我们还将得到有符号频率来表示旋转方向:如果相量逆时针旋转;这是一个正频率。如果相量顺时针旋转,这是一个负频率。这与将瞬时频率定义为相位的时间导数是一致的:相位变化与时间变化的关系。

下图展示了这一点,我们看到相量在复平面上逆时针旋转(“I”是同相或实轴,“Q”是正交或虚轴)。

正频率

现在欧拉在$\cos(\omega t)$$\sin(\omega t)$$e^{j \omega t}$之间的关系应该更有意义了;例如,我们现在可以看到如何:

$$2\cos(\omega t) = e^{j\omega t} + e^{-j \omega t}$$

这些只是以相等速率和相反相位(正频率和负频率)旋转的两个相量相加在一起。当您添加两个相量时,角度会取消,或以图形方式放置在另一个末端的相量上,如下面的绿色所示。在任何一种情况下,结果都是始终为实数的余弦(沿实轴来回振荡)。

欧拉

两个函数的相关度量的一般公式是复共轭积的积分:

$$corr = \int f_1(t)f_2^*(t)dt$$

共轭意味着反转相位,用“*”表示,如$x^*(t)$$x(t)$的共轭)例如,如上所示的余弦的两个相量是共轭关系. 一个相量是另一个相量的共轭。

上面显示的相关运算具有一个奇妙的特性,即“相似”信号会在积分中增长到相对较大的数量,而噪声会通过平均显着降低。要查看“相似”信号如何增长:考虑一个同相旋转的信号(恒定频率);如果我们将它乘以它的复共轭,我们会将它反旋转回正实轴,因此在积分中沿着实轴继续增长(因为$e^{j\omega t}e^{-j \omega t} =1$. 再举一个例子,考虑一个序列:1 -1 1 1 -1,如果我们将其与自身相乘,所有样本都将变为 1,总和(积分)将增长到 5。类似地,如果每个样本都是复数并且也有一个相位角度,如果我们将它乘以它的复共轭,我们将得到相同的结果,每个乘积为 1 并且总和增长到 5。每个样本上具有相同幅度但其他任意角度的任何其他序列都不会增长得那么大。

我们对傅里叶变换做同样的事情:

$$F(\omega) = \int x(t)e^{-j \omega t}dt$$

对于每个单一频率$\omega$,产生由$e^{j \omega t}$给出的旋转相量,我们将任意波形 x(t) 乘以复共轭$e^{-j \omega t} $和积分:我们将波形与$e^{j\omega t}$给出的每个频率相关联,并通过确定它在$x(t)$内的幅度和相位!当我们重复扫描每个感兴趣的$\omega$时,我们得到了所有频率的完整频谱。这就是傅里叶变换。


然后 OP 继续询问,并在评论中再次询问为什么选择相同的$\omega$将使给定相位角的结果与任何其他$\omega$相比最大化。考虑下图详述的欧拉给出的完整关系,作为我尝试使$e^{j\omega t}$更直观的延续:

复杂信号

因此,当我们与$e^{j \omega t}$相关时,我们正在与实部和虚部(余弦和正弦)相关,从而产生一个复杂的结果,其角度将是该音调在$x中的角度(t)$

$$F(\omega) = \int x(t)e^{-j \omega t}dt$$ $$= \int (x_i(t)+jx_q(t))(\cos (\omega t) + j\sin(\omega t)dt $$

如果我们将实部和虚部相乘,我们会看到当实音移动任何相位角时 ( $cos(\omega_o t + \phi)$,将其与 $e^{j\omega t}$相关联将当任何$\phi$的$\omega = \omega_o$时,都有一个最大幅度,并且相关性的结果复数输出(上面的实部和虚部)将处于相同的角度!

对于 OP 的问题$x(t)$是真实的情况,上述简化为:

$$F(\omega) = \int (\cos(\omega t - \phi))(\cos (\omega t) + j\sin(\omega t)dt $$

$$ = \int \cos(\omega t - \phi)\cos (\omega t) dt + j \int \cos(\omega t - \phi)\sin (\omega t) dt$$

我宁愿不使用正弦和余弦表示,即使在我自己的脑海中也能理解正在发生的事情,而是将$e^{j\omega_o t}$本身视为单个旋转相量。如果我们的信号$x(t)$也只是在$e^{j\omega_o t}$处的单个自旋相量,那么当我们做复共轭积时:$x(t)e^{-j\omega_o t} = e^{j\omega_o t}e^{-j\omega_o t} = e^{j0} = 1$ !! 我在底部的链接中以图形方式显示了这一点,但是在$x(t)$没有添加相位的情况下,我们在所有样本处旋转到实轴$(1)$,我们在时间段$T$上对其进行积分,导致$T$的最大结果没有虚项,所以它是$T\angle 0$如果我们再对$x(t)$加上相位旋转得到$e^{j\omega_o t + \phi}$乘积变为$x(t)e^{-j\omega_o t} = e^{ j\omega_o t + \phi}e^{-j\omega_o t} = e^{j\phi} = 1\angle \phi$这也将增长到相同的量级$T$但与角度$\phi$因此我们的输出是复杂的实部和虚部,我们也可以用正弦和余弦来达到很长的路(在我们的脑海中)。您可以通过使用正负频率音调( $e^{j\ omega_o t + \ phi}$ AMD$e^{-(j\omega_o t + \phi)}$ )。我在下面给出的链接中以图形和直观的方式展示了这一切。

然后查看相关过程本身如何最大化$e^{j\omega t}$信号的 SNR 的更多详细信息(在白噪声条件下是这样),请参阅我在这篇文章中的回复,其中包括显示当我们稍微偏离$\omega_o$时相关性如何下降:

最佳匹配滤波器的推导 - 卷积与相关

因为你的 (1) 中最好的$\phi$可以通过求解 $$\begin{aligned} f_i(\omega) = \int_t f(t) \cos(2\pi(\omega t))dt \ \ f_q(\omega) = \int_t f(t) \sin(2\pi(\omega t))dt \end{对齐} \tag a$$

然后认识到你的 (1) 的最优$\phi$

$$\phi(\omega) = \tan^{-1}\frac{f_q}{f_i} \tag b$$

这直接导致您的 (2) - 事实上,对于基带信号,使用$e^{2\pi i \omega t}$术语最终或多或少是 (a) 的简写(但它有如果您愿意接受的不仅仅是快速、定性的答案,那么它的意义更深远)。

不会在数学上证明这一点,因为你要求我不要这样做。 如果你觉得这令人痛苦地含糊不清,那么我建议你找一本书,对傅里叶变换的推导进行正式处理,并努力克服它。针对二年级工科学生的大学信号处理课本应该让你在平易近人和数学严谨性之间取得很好的平衡。一本关于微分方程的好的入门书也应该如此(更严谨一些,实际应用更少一些,并且通常为在四年级或研究生院进行更严格的处理奠定基础)。

如果你想了解更多,你必须从傅里叶级数开始。它们是必不可少的先决条件,并且在数学和概念上比傅立叶变换简单得多。至少你可以在一年而不是几年内学习傅里叶级数的基础知识,以及一些主要的技术背景!

正确理解傅立叶变换至少需要高级本科水平的专业纯数学,或达到博士学位。级别取决于您真正想去的深度。

一些必要的先决条件是经典数学分析;勒贝格积分和测度论;希尔伯特空间;泛函分析。确实,严格的傅里叶分析是这些主题最重要的应用和历史动机之一。即使对于非常有才华的学生,这需要多年的全日制学习才能掌握)。因此,以下内容受到技术警告、复杂性和故意过度简化的影响。如果没有上述背景,甚至不可能在足够普遍的情况下正确定义傅里叶变换。

从你的意思来说,傅里叶变换根本不是关于优化的。我们不是在寻找最接近信号的单相。这样的陈述是错误的和误导性的(虽然,我不知道你的书实际上是怎么说的,可能是你无意中改写了这本书并改变了超出预期的含义。我想它是为了只是一个有用的说明)。

傅里叶变换是关于“准确地”将信号$f(t)$ “分解”为纯信号$e^{i \omega t}$的组合,对于“每个”实数$\omega$

请注意上面的引号,它表示一些不可避免的过度简化!背后隐藏着一些非常困难的理论......

$\hat{f}(\omega)$的值通常是一个复数;最好尽快适应复指数,因为正弦和余弦在代数上非常麻烦)告诉你$e^确切数量{i \omega t}$存在于信号$f(t)$中。它们必须全部线性组合在一起才能得到$f$

$\hat{f}(\omega)$与您所说的任何类型的优化无关,并且它存在于所有实际值$\omega$(当然,对于某些值它可能为零,但通常是非零但对许多值衰减)。

好吧,好吧,如果你了解希尔伯特空间、正交投影和最小二乘估计,你会看到那里正在发生一种优化,但这会让我们走得太远)。

使这项工作发挥作用的关键事实是,我们正在考虑$\mathcal{L}^2$ Hilbert 空间中的函数,并且正弦曲线形成了该空间的标准正交基因此,您可以考虑线性泛函(我正在使用域$\Omega=[0,1]$编写) $$\begin{aligned} c, s &:\quad\mathcal{L}^2(\ Omega) \to \mathbb{R} \\ c(f) &= 2\cdot\int_\Omega\!\mathrm{d}t\:f(t)\cdot\cos(2\cdot\pi\cdot t) \\ s(f) &= 2\cdot\int_\Omega\!\mathrm{d}t\:f(t)\cdot\sin(2\cdot\pi\cdot t) \end{aligned} $$ 作为正弦和余弦函数本身的等效表示(参见Riesz 表示定理)。注意 $$\begin{对齐} c(\cos) =& 1 & c(\sin) =& 0 \\ s(\cos) =& 0 & s(\sin) =& 1 \end{对齐}$$

因此,正弦和余弦分量的任何线性组合都可以通过简单地查看从$c$$s$ 的应用中退出的系数,在原始分量中再次精确分析/分解

为了使它成为一个完整的证明,您仍然需要每个$L^2$函数实际上具有收敛到它的正弦曲线的线性组合,这是希尔伯特空间定义的完整性部分。