加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 一线动态

声学所团队在Interspeech 2021 DNS-Challenge中获得冠军

2021-10-13 声学研究所
【字体:

语音播报

  近期,在由Interspeech举办的2021深度噪声抑制挑战赛(Deep Noise Suppression-Challenge,以下简称DNS-Challenge)中,中国科学院噪声与振动重点实验室IACAS Lab9团队获得冠军,将本年度两次DNS-Challenge的冠军全部收入囊中。 

  DNS-Challenge由微软公司组织,每年开展两次,分别由语音信号处理领域知名会议InterspeechICASSP轮流举办。今年年初,IACAS Lab9团队曾在ICASSP 2021 DNS-Challenge中夺冠。

  本届DNS-Challenge比赛作为Interspeech2021六大挑战赛之一,主要围绕复杂场景下单通道语音增强任务,以平均主观意见分Mean Opinion Score, MOS为主要评价指标。该竞赛已举办至第三届,在业内极具影响力,吸引了亚马逊、快手、字节跳动、英特尔、三星、南京大学、西北工业大学、中国科学技术大学等众多国内外知名企业和科研院所参与。 

  本次竞赛共分为宽带场景实时降噪(Real-Time Denoising track for wideband scenario)和全频带场景实时降噪(Real-Time Denoising track for full-band scenario)两个赛道。其中实时赛道要求参赛模型在满足低延时要求下,对平稳目标、情感音频、英语语音、非英语语音、非英语音调和音乐进行增强。官方提供的测试音频包含仿真语音和各种实际场景下录制的语音,并带有不同程度的混响。相比前两届竞赛,难度大幅度提升,增加了大量的强瞬态噪声,声学环境更为复杂,增强的目标信号更加多样化。

  本次比赛中,IACAS Lab9团队提出了基于深度学习的幅度相位解耦优化的多阶段去噪去混响方案,前两个阶段,只在幅度域实现噪声和混响去除。在上述先验估计的基础上,第三阶段通过残差学习对幅度和相位信息显式修复从而对频谱进行进一步细化。最后使用极低复杂度的后处理模块进一步抑制残留噪声,以提升模型在低信噪比场景下的噪声抑制能力。此外,团队还设计了一种幂律压缩的MSE损失函数有效去除非稳态噪声,显著提升听感,取得宽带场景实时赛道第一名的成绩。同时,基于该方案撰写的论文A Simultaneous Denoising and Dereverberation Framework with Target Decoupling已被Interspeech 2021接收,并在会议上进行分享交流。 

打印 责任编辑:江澄

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn