院况简介
1949年,伴随着新中国的诞生,中国科学院成立。
作为国家在科学技术方面的最高学术机构和全国自然科学与高新技术的综合研究与发展中心,建院以来,中国科学院时刻牢记使命,与科学共进,与祖国同行,以国家富强、人民幸福为己任,人才辈出,硕果累累,为我国科技进步、经济社会发展和国家安全做出了不可替代的重要贡献。 更多简介 +
院领导集体
创新单元
科技奖励
科技期刊
工作动态/ 更多
中国科学院学部
中国科学院院部
语音播报
当环境中存在噪声或混响干扰时,传统的降噪算法或解混响算法可有效抑制相应的干扰,但当这两种干扰同时存在时,这些算法的性能明显下降,从而导致语音通信的质量与自动语音识别系统的准确率降低。
为了同时抑制环境中存在的噪声与混响,中国科学院声学研究所语言声学与内容理解重点实验室的硕士生宋思远与其导师、研究员李军锋等,提出一种融合多通道加权预测误差与多通道维纳滤波的一体化降噪与解混响算法。相关研究成果以An integrated multi-channel approach for joint noise reduction and dereverberation为题,在线发表在Applied Acoustics上。
研究人员用加入单通道维纳后滤波的最小方差无失真响应(Minimum Variance Distortionless Response, MVDR)波束形成器实现了多通道维纳滤波器,其输入为加权预测误差(Weighted Predict Error, WPE)预处理器的输出信号。他们采用相对早期传递函数,而非整个相对传递函数或直达声信号,来实现MVDR波束形成器,并使用WPE的预测对干扰信号的协方差矩阵进行近似计算;随后根据整个系统的输出信号,更新WPE中的目标信号方差。模拟和真实条件下的实验结果表明,在噪声与混响同时存在的环境下,该方法可对语音进行有效地增强处理。当麦克风与声源距离为3米时,算法处理后的语音识别词错率降低38.50%。研究人员将该方法与五种最近被提出的相关算法进行对比,结果表明,新算法在语音质量、语音清晰度和语音识别性能等方面优于其他算法。
当环境中存在噪声与混响时,该研究在较大程度上提升了语音通信系统与自动语音识别系统的用户体验。研究工作获得国家重点研发计划和国家自然科学基金的资助。
该研究所提算法的系统结构(图/中科院声学所)
扫一扫在手机打开当前页
© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 中国科学院 版权所有
京ICP备05002857号-1
京公网安备110402500047号
网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话:86 10 68597114(总机)
86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn