加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

声学所提出一体化降噪与混响消除算法

2020-11-23 声学研究所
【字体:

语音播报

  当环境中存在噪声或混响干扰时,传统的降噪算法或解混响算法可有效抑制相应的干扰,但当这两种干扰同时存在时,这些算法的性能明显下降,从而导致语音通信的质量与自动语音识别系统的准确率降低。

  为了同时抑制环境中存在的噪声与混响,中国科学院声学研究所语言声学与内容理解重点实验室的硕士生宋思远与其导师、研究员李军锋等,提出一种融合多通道加权预测误差与多通道维纳滤波的一体化降噪与解混响算法。相关研究成果以An integrated multi-channel approach for joint noise reduction and dereverberation为题,在线发表在Applied Acoustics

  研究人员用加入单通道维纳后滤波的最小方差无失真响应(Minimum Variance Distortionless Response, MVDR)波束形成器实现了多通道维纳滤波器,其输入为加权预测误差(Weighted Predict Error, WPE)预处理器的输出信号。他们采用相对早期传递函数,而非整个相对传递函数或直达声信号,来实现MVDR波束形成器,并使用WPE的预测对干扰信号的协方差矩阵进行近似计算;随后根据整个系统的输出信号,更新WPE中的目标信号方差。模拟和真实条件下的实验结果表明,在噪声与混响同时存在的环境下,该方法可对语音进行有效地增强处理。当麦克风与声源距离为3米时,算法处理后的语音识别词错率降低38.50%。研究人员将该方法与五种最近被提出的相关算法进行对比,结果表明,新算法在语音质量、语音清晰度和语音识别性能等方面优于其他算法。

  当环境中存在噪声与混响时,该研究在较大程度上提升了语音通信系统与自动语音识别系统的用户体验。研究工作获得国家重点研发计划和国家自然科学基金的资助。

  论文链接

该研究所提算法的系统结构(图/中科院声学所)

打印 责任编辑:董凯悦

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn