我正在寻找一种方法来计算语音信号中的瞬时音高变化,以用于时间扭曲应用。帧内的逐个样本频率变化知识将在时间扭曲中提供更准确的输出。
到目前为止,我读到了一种基于 Teager 能量算子的方法。请为我推荐一些其他方法。