此前已针对单通道语音增强任务,推出了DCCRN[1]、DCCRN+[2],针对单通道语音增强去混任务,提出了UFormer[3],针对多通道语音增强、分离及去混问题推出了DESNet[4]等模型,基于DCCRN的衍生模型如图1所示。 近期,实验室和腾讯天籁实验室针对单通道超宽带语音增强任务提出了S-DCCRN模型,其相关论文" S-DCCRN: SUPER WI...
Spatial-DCCRN是基于S-DCCRN[3]的进一步改进,通过角度特征提取模块以及混合滤波器的帮助下,Spatial-DCCRN在3D语音增强L3DAS22 challenge数据集[6]上指标超越了频域模型DCCRN、EabNet[7]、时域模型FasNet[8],在多通道实录会议数据集ConferencingSpeech2021[9]上客观指标超过了竞赛第一名MIMO-UNet[10],现对该论文进行...