目前,Whisper 已经有了很多变体,也成为很多 AI 应用构建时的必要组件。最近,来自 HuggingFace 的团队提出了一种新变体 —— Distil-Whisper。这个变体是 Whisper 模型的蒸馏版,特点是模型小、速度快,而且准确度还很高,非常适合在要求低延迟或资源有限的环境中运行。不过,与能够处理多种语言的原始 Whisper 模型不同,...
与其前身 Whisper 大型版本 3 相比,Turbo 版在解码层数上从 32 降至 4,运行速度更快,尽管质量略有下降,但差别非常小。 我们将通过 Hugging Face 本地安装该模型,尝试几个音频文件: 创建一个简单的虚拟环境 安装一些先决条件,包括 Torch、Transformers 等。 现在启动 Jupyter Notebook Jupyter Notebook 启动后,我...
因为大数据已经把一切都记下来了? 如果有时间,大家可以直接试用一下这个模型,Whisper - a Hugging Face Space by openai , 相信你试过中文与英文的效果后,一定会觉得太好用了吧。这样一个东西开源出来,真的是AI在努力改变这个世界啊。 所以来仔细分析一下这个模型,还是非常有意义的。 基础信息 官方地址:Introducin...
为了解决这个问题,我们可以利用 Distil-Whisper,这是 Hugging Face 提供的 Whisper 模型的精简版,它可以减小模型大小,同时保留其大部分性能。在这篇博文中,我们将探讨如何使用 Distil-Whisper 实现实时语音转文本系统,直接从麦克风获取输入。此外,我们将讨论集成 Redis 以实现高效的进程间通信,以及如何构建代码以实现模块...
站长之家(ChinaZ.com)11月9日 消息:Hugging Face研究人员最近解决了在资源受限环境中部署大型预训练语音识别模型的问题。他们通过创建一个庞大的开源数据集,使用伪标记的方法,提炼出了Whisper模型的较小版本,称为Distil-Whisper。 图源备注:图片由AI生成,图片授权服务商Midjourney ...
Whisper模型的权重可以从OpenAI的官方GitHub仓库或Hugging Face网站上下载。 2.2 模型选择 根据需求选择合适的Whisper模型规格,从小模型到大模型,根据资源和性能需求权衡。 2.2.1 模型选择需要考虑的因素 任务需求:不同的任务可能需要不同大小的模型。例如,如果任务需要对多种语言进行高精度识别,可能需要较大的模型。性...
针对Whisper的这一问题,OpenAI已公开表达了其安全使用的警告,特别是不建议在重大决策中依赖该模型。尽管如此,随着应用的普及,Whisper在开源平台Hugging Face上的下载量已超过420万次,显示了其在开发者社区中的受欢迎程度。这也引发了对AI工具在实际应用中可靠性的深思。
【Distil-Whisper:蒸馏版Whisper,将语音识别速度提高6倍,模型瘦身49%】’Distil-Whisper' by Hugging Face GitHub: github.com/huggingface/distil-whisper #开源# #机器学习# û收藏 99 10 ñ80 评论 o p 同时转发到我的微博 按热度 按时间 正在加载,请稍候... AI博主 3 公...
近日,aiOla 宣布推出一款开源的 AI 音频转录模型Whisper-NER ,该模型在转录过程中能够实时遮蔽敏感信息。aiOla 的新 Whisper-NER 构建在 OpenAI 的行业标准开源模型 Whisper 之上,本身是完全开源的,现在可以在 Hugging Face 和 Github 上获得,供企业、组织和个人使用、使用、适应、修改和部署。该音频转录模型具备...
3. Re:开源开发者指南:欧盟《人工智能法案》解读 有些国家的AI就是用于上面的这几类风险中的, 人脸识别,催缴的电话外呼,有的公司还为此申请了专利 --码农加一 4. Re:为数据集而生的 SQL 控制台 感谢分享 --潇洒人生梦 5. Re:Hugging Face 论文平台 Daily Papers 功能全解析 支持!!! --南风丶丶Copyr...