面向世界科技前沿,面向国家重大需求,面向国民经济主战场,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

声学所将可控制残差噪声的语音增强方法用于语音通讯

2020-08-04 声学研究所
【字体:

语音播报

  在抑制背景噪声的同时避免引入不自然的失真是语音通讯中的重要课题。目前,基于深度学习的语音增强方法能够有效减少背景噪声成分,但会在噪声失配条件下会引入较多不自然的残差噪声,对语音舒适度造成影响。

  近日,中国科学院噪声与振动重点实验室研究生李安冬及其导师郑成诗等提出一种带有残差噪声控制的语音增强方法用于语音通讯,在人为保留较低背景噪声的前提下,以噪声抑制与语音失真最小化为目标进行联合优化,提高语音舒适度。

  该研究通过引入多个可调节参数推导出一种广义损失函数,用不同参数组合使增强后的语音进行有效权衡,并通过人为引入较低的背景噪声参与优化有效增强语音的主观听觉质量。实验结果表明,选择合理的参数组合,可使增强后的语音在客观指标与主观评估结果上优于以往的处理结果。许多常用的损失函数均可被视为这种广义损失函数的特殊情况,并用上述方法进行优化。

  相关成果发表于Applied Sciences。研究得到国家自然科学基金资助。

  论文链接 

不同参数组合的客观指标对比

打印 责任编辑:程博

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号 京公网安备110402500047号

地址:北京市三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(值班室)

编辑部邮箱:casweb@cashq.ac.cn