我目前正在阅读穆勒的“音乐处理基础”,并试图通过使用自相似矩阵来理解音频分割。
目前,我的矩阵看起来不错,我正在尝试理解对角线下“棋盘幻灯片”的使用,其中较大的差异应该表示乐曲的不同部分(嗯,在一个完美的世界中......)。
我在生成“高斯锥形棋盘”时遇到了麻烦,而且我无法轻松地在网上找到任何对我有帮助的具体参考资料。
据我了解,棋盘最初看起来像这样:
[-1, -1, 0, 1, 1;
-1, -1, 0, 1, 1;
0, 0, 0, 0, 0;
1, 1, 0,-1,-1;
1, 1, 0,-1,-1]
Mueller 提供的径向对称高斯函数公式如下:
生成的棋盘格将这样计算:
这意味着棋盘的三维表示看起来类似于以下内容:
现在,我可能很容易对它的计算方式感到困惑,但以下是我对它如何工作的想法:
假设我们正在计算点对于我们的高斯函数,这意味着我们将有.
然而,这是没有意义的,因为随着我们前进,高斯棋盘应该逐渐变为零。此外,作为和增加,会减少并接近零,这与我对棋盘格的期望不符。
所以:
任何人都可以帮助解释我在这里缺少什么可以让我按照我的预期生成棋盘吗?是否有任何关于我忽略的工作原理的好读物?
我也没有找到任何关于为 epsilon 选择好的值的材料。我怎么知道如何为给定的输入选择“最佳”值?例如,这只是反复试验,还是我应该在不同音乐文件中保持一致的阈值?
谢谢你的帮助!(如果有更好的方法在这里格式化矩阵,我很想知道......)