[1] github:https://github.com/xenova/whisper-web [2] huggingface:https://huggingface.co/openai/whisper-large-v3-turbo [3] https://www.youtube.com/watch?v=9zdbH-DJAs8
今天终于决定,装一下whisper试试。 模型可以在huggingface下载,前面参考文章里有,不赘述了。提醒一下的是,如果从huggingface上用下载的方式(非git clone)下载到的一些json文件扩展名是txt,需要改成json: added_tokens.json preprocessor_config.json config.json pytorch_model.bin.index.fp32.json generation_config.j...
除了可以用于语音识别,Whisper 还能实现多种语言的转录,以及将这些语言翻译成英语。目前,Whisper 已经有了很多变体,也成为很多 AI 应用构建时的必要组件。最近,来自 HuggingFace 的团队提出了一种新变体 —— Distil-Whisper。这个变体是 Whisper 模型的蒸馏版,特点是模型小、速度快,而且准确度还很高,非常适合在要求...
模型已经开源到Huggingface,欢迎下载: Belle-whisper-large-v3-zh-punct CER(%) Belle-whisper-large-v3-turbo-zh whisper-large-v3-turbo只是在识别精度轻微下降的同时,大幅提升了识别速度(7~8倍提升),有很强的应用价值。本文作者基于中文开源数据(AISHELL1 AISHELL2 WENETSPEECH HKUST),对whisper-large-v3-turbo...
AIWizards /whisper-large-v3 框架: JAX Safetensors PyTorch 其他: audio automatic-speech-recognition hf-asr-leaderboard + 1 更多 License: License: apache-2.0 加入合集 模型评测 部署 微调实例 下载模型whisper-large-v3 提交历史 Upload folder using huggingface_hub 4898609 huggingface-web 1 年前...
我想写一个python程序,在我发出“过”的语音时,打印“过”(实际上是执行某种操作,我会将它嵌入到其他程序中,目前只打印字符串),在我发出“下一个”的语音时,打印“下一个”,我想使用https://huggingface.co/openai/whisper-large-v3实现 import whisper import sounddevice as sd import numpy as np # 录音设置...
parser.add_argument("--model-path", type=str, help="path to the model (e.g. if published on HuggingFace: Oblivion208/whisper-tiny-cantonese)", required=True) parser.add_argument("--encoder-only", type=bool, help="only convert encoder", default=False) parser.add_argument("--quantize",...
**Aria 多模态模型发布** :Rhymes AI 发布了 Aria 模型,这是一种多模态专家混合(MoE)模型,作为开源项目在 Apache 2.0 许可证下发布,具有 3.9B 活跃参数和 64K 令牌上下文窗口,在各种任务中性能优于 Pixtral 和 Llama,详细信息请参见[公告推文](https://news.miracleplus.com/share_link/43865)。 **OpenAI...
根据Awni Hannun的测试结果,在M2 Ultra平台上,Whisperlarge-v3-turbo能在仅仅14秒内完成12分钟语音内容的转录,实时转录能力得到了极大验证。这一速度对于需要高效处理信息的企业和个人用户来说,无疑是一个巨大的利好。通过Github、HuggingFace等平台,用户们可以便捷地下载和体验这个模型,随时随地提高工作效率。
Sure :) https://huggingface.co/leafspark/whisper-large-v3-ggml/ darnn commented Oct 11, 2024 Thank you! Unfortunately the results are the same as they were when I tried it last time (I thought maybe the issue was the model I downloaded) - at least in Hebrew, there are many more ...