在阅读不同的统计模型时,我经常看到术语白噪声出现。然而,我必须承认,我并不完全确定这意味着什么。它通常缩写为。这是否意味着它是正态分布的还是可以遵循任何分布?
统计中的白噪声
TL;博士
答案是否定的,不一定是正常的;是的,它可以是其他发行版。
噪音的颜色
让我们谈谈噪音的颜色。
- 婴儿在空中旅行时发出的噪音不是白色的。它有颜色。
- 飞机引擎发出的声音也不是白色的,但它不像孩子的声音那样有色。它更白。
- 海洋或森林产生的噪音几乎是白色的。
如果您使用降噪耳机,您就会知道#1是不可能取消的。它可以轻松穿透任何耳机。#2 会很好地取消。
至于#3,你为什么要取消它?
“颜色”一词的由来
这三种噪音有什么区别?它来自光谱分析。正如您在高中时期所知道的那样,您可以通过棱镜发送白光,它将光分成各种不同的颜色。这就是我们所说的白色:所有颜色的比例大致相同。没有颜色占主导地位。
图片来自https://www.haikudeck.com/waves-and-light-vocabulary-uncategorized-presentation-w5bmS88NC9
颜色是特定频率的光,或者您可以说特定波长的电磁波,如下所示。红色相对于蓝色的频率较低,相当于红色的波长较长,接近 800nm,而蓝色波长为 450nm。
图片来自这里:https ://hubpages.com/education/Teachers-Guide-for-Radiation-beyond-Visible-Spectrum
光谱分析
如果您将噪声(无论是声学、无线电还是其他噪声)通过频谱分析工具(如 FFT)发送,您就会得到频谱分解。您会看到每个频率中有多少是在噪声中,如维基百科的下一张图片所示。很明显,这不是白噪声:它在 50Hz、40Hz 等处有清晰的峰值。
如果一个窄频带突出,那么它被称为有色,而不是白色。因此,白噪声就像白光一样,它具有大致相同比例的广泛频率,如下图所示。上图显示了幅度的记录,下图显示了频谱分解。没有频率突出。所以噪音是白色的。
完美正弦
现在,为什么独立同分布随机数(iid)序列会产生白噪声?让我们想想是什么让信号变成彩色的。它是某种频率的波从其他波中突出来。他们主导着频谱。考虑一个完美的符号波:。秒
的任意两点之间的协方差是多少
因此,在存在正弦波的情况下,我们将在时间序列中得到自相关:相隔半秒的所有观测都将完全负相关!现在,说我们的数据是独立同分布的,这意味着没有任何自相关。这意味着信号中没有波。噪声的频谱是平坦的。
不完美的例子
这是我在计算机上创建的示例。我首先记录了我的音叉,然后我记录了电脑风扇的噪音。然后我运行以下 MATLAB 代码来分析光谱:
[y,Fs] = audioread(filew);
data = y(1000:5000,1);
plot(data)
figure
periodogram(data,[],[],Fs);
[pxx,f] = periodogram(data,[],[],Fs);
[pm,i]=max(pxx);
f(i)
这是音叉的信号和频谱。正如预期的那样,它的峰值在 440Hz 左右。音叉必须产生近乎理想的正弦波信号,就像我之前的理论示例一样。
接下来我对噪音做了同样的事情。正如预期的那样,没有频率突出。显然这不是白噪声,但它非常接近它。我认为一定有非常高的音调,这让我有点困扰。我需要尽快更换风扇。但是,我在光谱中看不到它。可能是因为我的麦克风太烂了,或者采样频率不够高。
分配不重要
重要的部分是,在随机序列中,数字不是自相关的(甚至更强的,独立的)。确切的分布并不重要。它可以是高斯或伽马,但只要数字在序列中不相关,噪声就会是白色的。
白噪声仅仅意味着样本序列与零均值和有限方差不相关。抽取样本的分布没有限制。现在,如果样本恰好是从正态分布中提取的,那么您就会得到一种特殊类型的白噪声,称为高斯白噪声。