加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

声学所提出基于深度学习的空间信息保持的双耳语音增强方法

2019-10-14 声学研究所
【字体:

语音播报

  由于语音通常受到背景噪声和环境干扰的影响,语音增强技术在过去几十年中深受关注。近年来,基于深度学习的语音增强方法在应对非平稳噪声方面表现突出,并可显著提高语音的可懂度。对双耳听力的研究表明,保留语音中的空间信息有助于人耳对噪声环境中语音的理解,然而,大部分语音增强方法的目标为单通道语音信号,不能保留原有的空间信息。

  对此,中国科学院声学研究所语言声学与内容理解重点实验室的孙兴伟与其导师李军锋等人研究语音增强方法以及双耳信号空间信息保持,提出一种基于深度学习的保持空间信息的双耳语音增强方法,在语音增强的同时保留其空间信息,有助于提高人耳对语音的理解能力。相关研究成果近期发表于国际学术会议2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)

  该研究将双耳信号的左右通道组合为一个复数信号,将一个双通道增强问题转换为一个在复数域处理的单通道增强问题。随后研究人员提出一种复数域时频掩蔽方法,并训练一个复数神经网络对其进行估计,最终应用于单通道复数信号进行语音增强并重建双耳信号。

  实验结果表明,基于复数神经网络的双耳语音增强方法将语音信号的信噪比提升超过10dB,并且能够保持语音原有的空间信息。

  此双耳语音增强方法可应用于助听器等设备,帮助人耳理解语音。

  该研究得到国家自然科学基金(11590770-41172243761650202U153611761671442116743521150440661601453)、国家重点研发计划(2016YFB08012032016YFC08005032017YFB1002803)和新疆维吾尔自治区重大科技专项(2016A03007-1)资助。

  论文链接

算法系统框图(图/中科院声学所)

打印 责任编辑:叶瑞优

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn