最绝的是它的语音识别能力!在AISHELL-1上字错误率低至0.60% ,直接碾压Whisper和Paraformer👏 而且支持端到端语音对话,连情绪、口音、语速都能个性化控制,生成的语音超自然~ 流式生成技术也超给力,延迟低到几乎感觉不到!部署和使用也超简单~不管是Docker还是本地部署,跟着教程几步就能搞定。还贴心地