鸡尾酒会问题是一个盲源分离(BSS) 问题。
给定信号的线性混合:
y[n]=Ax[n]
我们试图估计信号。随时间变化时
,模型会变得更加复杂:x[n]
A
y[n]=A[n]x[n]
我们有 3 种主要方法来解决这个问题:
- 概率方法
将信号视为分布点的集合,并找到线性坐标变换以保证某些属性。PCA 方法试图去除相关性(第二时刻信息),而 ICA 试图去除更高时刻的相关性(基本上是统计独立性)。
- 时间信号处理方法
如果有 2 个信号,其中一个是参考信号,我们可以使用自适应去相关滤波器。基本上,我们是在从信号中删除任何时间相关性之后。
- 空间信号处理方法
我们可以利用房间中麦克风的已知位置来创建自适应波束成形。这个想法是数据的延迟自适应求和可以改变阵列的空间曲线并匹配某个方向。
当然,近年来,我们可以利用深度学习方法找到有关该主题的工作。它们的主要优势是能够整合额外的信息(比如使用信号的属性,无论是某种语言,在场景中整合视觉数据,如图像和视频[谁在什么时候动嘴唇?])。
这是一个广泛的主题,主要思想是根据您的具体情况定制解决方案。
现代鲁棒 ICA 和 IVA(独立向量分析)可能非常有效。
我会先尝试它们,除非你有匹配自适应滤波器的情况(可以证明在某些条件下匹配波束形成解决方案)。