我目前正在研究一种动态均衡器,以提高合成语音在嘈杂环境中的清晰度。
我的算法的当前实现只是将参数 EQ 应用于环境噪声的主要频率处的语音(例如:如果在声学场景中检测到 180Hz 左右的峰值 - 例如来自风扇 - 该算法在 180Hz 处应用 PEQ )。
这个实现没有考虑到听觉掩蔽现象。在我看来,提高相邻频率的声音以尝试使声音成为掩蔽器会更聪明。
尝试以这种方式解决问题真的更好吗?如果是这样,我可以查看哪些资源来获得有关如何实现此算法的一些灵感。
我目前正在研究一种动态均衡器,以提高合成语音在嘈杂环境中的清晰度。
我的算法的当前实现只是将参数 EQ 应用于环境噪声的主要频率处的语音(例如:如果在声学场景中检测到 180Hz 左右的峰值 - 例如来自风扇 - 该算法在 180Hz 处应用 PEQ )。
这个实现没有考虑到听觉掩蔽现象。在我看来,提高相邻频率的声音以尝试使声音成为掩蔽器会更聪明。
尝试以这种方式解决问题真的更好吗?如果是这样,我可以查看哪些资源来获得有关如何实现此算法的一些灵感。