GLM-4-Voice 9B是一款支持英语和中文实时语音交互的端到端模型,具备低延迟响应和可定制声音属性。文章介绍了其独特架构、设置步骤及在客户服务、教育等领域的应用潜力,强调其作为多语言对话AI工具的优势。
清华、智谱团队推出情感语音模型 | 来自清华大学和智谱的研究团队推出了一款智能和类人的端到端语音模型——GLM-4-Voice。它支持中文和英文,能进行实时语音对话,并能根据用户指令改变语音的细微差别,如情感、语调、语速和方言。GLM-4-Voice 采用超低比特率(175bps)、单码本语音 tokenizer,帧频为 12.5Hz,由自动语音...
THUDM/GLM-4-VoicePublic NotificationsYou must be signed in to change notification settings Fork221 Star2.7k Code Issues46 Actions Projects Security Insights New issue Closed Description zajzhuaijun sixsixcoder commentedon Jan 3, 2025 sixsixcoder ...