WELCOME TO ISCSLP 2024 The 14th International Symposium on Chinese Spoken Language Processing (ISCSLP 2024) will be held in Beijing on 7-10 November 2024. We warmly welcome you to join this event. International Symposium on Chinese Spoken Language Processing (ISCSLP) is the flagship conference of...
ISCSLP2024-多模态构音障碍严重程度自动评估挑战赛构音障碍是一种由神经系统疾病引起的言语障碍,严重影响个人的正常交流、工作、生活和学习。在神经康复领域,早期、客观、准确的评估和诊断对构音障碍的治疗和康复至关重要。机器辅助的自动化构音障碍评估可以提供远程、低
挑战赛结果公布 | ISCSLP2024 对话语音克隆挑战赛(CoVoC) 2024年6月,由晴数智慧(Magic Data)联合西北工业大学音频语音与语言处理研究组(ASLP@NPU)、新加坡资讯通讯研究院(I2R)、深圳大数据研究院(SRIBD)、香港中文大学(深圳)等多家单位在2024年中文口语语言处理国际会议(ISCSLP2024)上推出了对话语音克隆挑战赛(Conv...
The Inspirational and Convincing Audio Generation Challenge 2024 (ICAGC 2024) is part of theISCSLP 2024Competitions and Challenges track. While current text-to-speech (TTS) technology can generate high-quality audio, its ability to convey complex emotions and controlled detail content remains limited....
本次“多模态构音障碍严重程度自动评估挑战赛”,将作为ISCSLP 2024的Special session内容之一进行发表。第十四届国际汉语口语处理研讨会(ISCSLP 2024)是SIG-CSLP的旗舰会议,并且将于2024年11月7-10日在北京举行。这是一个两年一度的会议,由科学家、研究人员和从业者报告和讨论汉语口语处理的所有理论和技术方面的最新进...
我们提供一套Baseline代码,地址为:https://github.com/ToughmanL/MSDM-ISCSLP2024 引用 [1]. Liu J, Du X, Lu S, et al. Audio-video database from subacute stroke patients for dysarthric speech intelligence assessment and preliminary analysis[J]. Biomedical Signal Processing and Control, 2023, 79...
ISCSLP2024_CoVoC_baseline 本次竞赛baseline共有两个模型 模型一:VALL-E 基于开源代码Amphion训练,训练过程分为两步,首先在Wenetspeech4TTS数据集上进行训练,之后在HQ-Conversations进行微调训练。 模型的权重部分已经在放置在huggface 训练过程中,文本输入的方式与原Amphion代码略有不同,具体方式见inference.ipynb 文本...
FCTalker: Fine and Coarse Grained Context Modeling for Expressive Conversational Speech Synthesis (Accepted by ISCSLP'2024) - walker-hyf/FCTalker
11月10日,由国际语音通信协会(ISCA)中文口语处理特别兴趣小组(SIG-CSLP)、清华大学自动化系主办,中国图象图形学学会、中国人工智能学会协办的第十四届中文口语语言处理国际会议(ISCSLP 2024)在北京圆满结束,远鉴信息荣获个性化特征诱导情感识别挑战赛(IERP Challenge 2024)冠军。
ISCSLP2024_CoVoC_baseline 本次竞赛baseline共有两个模型模型一:VALL-E基于开源代码Amphion训练,训练过程分为两步,首先在Wenetspeech4TTS数据集上进行训练,之后在HQ-Conversations进行微调训练。模型的权重部分已经在放置在huggface训练过程中,文本输入的方式与原Amphion代码略有不同,具体方式见inference.ipynb...