近日,清华大学语音和语言技术团队联合北京邮电大学发布了中国明星多场景音视频多模态数据集 (CN-Celeb-AV),供音视频多模态身份识别 (AVPR) 等领域的研究者使用。本数据集包含来自1,136名中国明星,超过419,000个…
作者在两个比较流行的说话人识别算法i-vector和x-vector上做了实验,并与英文说话人识别自然场景数据集voxceleb进行对比,从实验结果看,一方面能够表明CN-Celeb的更具挑战性,另一方面也可看出非约束条件下的说话人识别的真实效果还有待提高。 CN-Celeb: 数据分布:CN-Celeb数据集跨越11种真实的场景,每一个说话人至少包...
数据集介绍 CN-Celeb测试集和数据列表,可以用于声纹识别模型评估 文件列表 cn-celeb-test.zip cn-celeb-test.zip (461.59M) 下载 File Name Size Update Time cn-celeb-test/enroll/id00997-enroll.mp3 87597 2023-08-02 22:39:42 cn-celeb-test/enroll/id00989-enroll.mp3 113085 2023-08-02 22:39:54...
表1 VoxCeleb和CN-Celeb在不同声纹识别系统上的性能对比 综上,测试数据的场景受限问题是造成当前声纹评测与实际性能不一致的关键因素之一。为了更好地评测声纹识别系统在实际场景下的真实性能,我们发布了多场景声纹数据集 CN-Celeb。实验表明,当前主流的声纹识别系统在复杂场景下的表现并不如意,也证明了多场景声...
针对CN-Celeb数据集的基于ECAPA-TDNN的说话人识别的pytorch实现 pytorchspeaker-recognitionspeaker-verificationvoiceprint-recognitioncn-celebecapa-tdnn UpdatedApr 3, 2023 Python To associate your repository with thecn-celebtopic, visit your repo's landing page and select "manage topics."...
CNSRC 2022 (CN-Celeb Speaker Recognition Challenge 2022) 是由 Odyssey 2022 组委会发起,由清华大学、厦门大学、希尔贝壳公司联合承办的说话人识别竞赛。本次竞赛的核心目的是验证当前说话人识别 (或称声纹识别) 技术在实际复杂场景下的真实可用性。日前,竞赛组织者公布了开发数据集 (Development Set),并推出了两...
注:该 demo 使用 CN-Celeb 数据集,包括至少 650000 条音频,3000 个说话人,来建立音频向量库(音频特征,或音频说话人特征),然后通过预设的距离计算方式进行音频(或说话人)检索,这里面数据集也可以使用其他的,根据需要调整,如Librispeech,VoxCeleb,UrbanSound,GloVe,MNIST等。 使用方法 1. PaddleSpeech 安装 音频向量...
他们评估了Face X-Ray归纳四个数据集的能力,包括上述Face Forensics++语料库的一个子集;Google发布的数千个视觉deep fake视频集合,deep fake用于检测挑战赛的图像;以及Celeb-DF,一个包含408个真实视频和795个合成视频且视觉伪影减少的语料库结果显示,Face X-Ray可以快速地识别出之前未被找出的伪造图片,并准确地预测...
Hyperconnect的研究人员通过使用VoxCeleb1和CelebV(两种名人照片和视频的开源资料库)对MarioNETte进行了培训和测试。使用来自VoxCeleb1的1,251个不同名人对模型和基线进行了训练,并通过从随机选择的100个VoxCeleb1视频中抽取2,083个图像集(加上CelebV中每个名人的2,000个图像集)采样,对一组模型进行了测试。
【希尔贝壳 AISHELL 讯】CNSRC 2022(CN-Celeb Speaker Recognition Challenge 2022) 是由 Odyssey 2022 组委会发起,由清华大学、厦门大学、北京希尔贝壳科技有限公司联合承办的说话人识别竞赛。本次竞赛的核心目的是验证当前说话人识别 (或称声纹识别) 技术在实际复杂场景下的真实可用性。日前,竞赛组织者公布了开发数据...