我有一个音频文件,我在 R 中计算了 16 个(实际上是 15 个,因为我省略了第一个)MFCC。当我通过 VLC-Player 和 Icecast2-Server 流式传输此文件时,用 Java 接收它(使用 Javazoom 的播放器- Lib)然后再次将其传递给 R 进行 MFCC 计算我得到完全不同的值?有谁知道为什么会这样?
附加信息:
- 当我再次将接收到的数据写入文件并在原始文件旁边查看时,它们看起来几乎相同(波形+频谱图)。
- 该文件长度为 3 秒,包含过往车辆(汽车)的声音。
- MFCC 是针对居中的 44100 个样本计算的。
- 我需要有效数据才能使用 SVM 自动对汽车和卡车进行分类。该分类器使用从 150 个音频文件(每个文件包含一辆车)计算得出的特征进行训练。
- 由于 R 在直接读取和处理 mp3 文件时遇到问题,我首先将 wav 转换为 mp3 并再次转换回来(为了“模拟”由于压缩导致的信息丢失)。

此外,我会自动检测连续音频流中的车辆,因此(对于上面的特定示例数据)用于计算 MFCC 的波形具有大约 4400 个样本的偏移量。这对 44100 个样本的分析窗口有影响吗?