我有音频信号的直方图,它们具有双峰“正态”分布。我想要做的是检测这些亚群以便有一个阈值,这意味着将值划分为背景噪声和语音,背景噪声和语音因为每个都意味着有其正态分布。这是一个预处理步骤,因此可用于根据它做出以后的决策。
这是我的能量值时间序列(以 DB 为单位)并低于其相应的直方图


我正在考虑实施 K-Means 聚类算法来检测分布。现在我的问题是:
这是正确的解决方案吗?选择错误的初始方法让我担心算法将无法正确聚类。
分离这两个分布的其他解决方案是什么,我看过 GMM,但不确定它有什么帮助。
- 如果 K-Means 在某种程度上适合解决这样的问题,我应该如何选择初始均值,还是主要取决于数据?
请注意,我是这个领域的新手,所以如果我犯了任何可怕的错误,我希望能纠正我