whisper.cpp是一个C++编写的轻量级开源智能语音识别库,是基于openai的开源python智能语音模型whisper的移植版本,依赖项少,内存占用低,性能更优,方便作为依赖库集成的到应用程序中提供语音识别功能。 以下基于whisper.cpp的源码利用C++ api来开发实例demo演示读取本地音频文件并转成文字。 项目结构 whispercpp_st
OpenAI 的 Whisper 自动语音识别 (ASR) 模型的高性能 GPGPU 推理 This project is a Windows port of the whisper.cpp implementation. Which in turn is a C++ port of OpenAI’s Whisper automatic speech recognition (ASR) model. 下载WhisperDesktop 后,点击运行,然后加载模型文件,最后选择文件即可进行转录。...
OpenAI的Whisper模型以其出色的准确率和效率在语音识别领域崭露头角。然而,其官方实现多基于Python,对于追求极致性能和高并发处理的场景,C++无疑是一个更具吸引力的选择。本文将引导您通过C++实现一个高效的实时语音转文字系统,命名为Whisper.cpp。 1. 技术选型与架构设计 核心组件: Whisper模型:使用ONNX (Open Neur...
18 非常干货 01 songquan 2023/10/21 05:44 太棒了,近期刚好在折腾语音转录,正如文中所说:困了就有人递枕头的感觉 01 淳帅二代 2023/10/19 22:41 你是还没用 Const-me 的 Whisper 版本,基于 Whisper.cpp 开发的,用了 DirectX 加速,核显也能用 large 模型,速度是 Python Whisper 的几倍,Faster-...
不需要python,使用Windows自带的Media Foundation架构代替了FFmpeg进行音频读取,基本不需要装依赖(N卡要装CUDA)。 https://github.com/Const-me/Whisper 有图形化界面(Release里下载WindowsDesktop),也推荐使用图形化界面。其CLI与openai/whisper并不兼容。 您可以从 https://huggingface.co/ggerganov/whisper.cpp/tree...
whisper.cpp是一款轻量级的开源C++智能语音识别库,基于openai的开源python模型whisper进行移植,其设计旨在减少依赖项,降低内存使用,提升性能,方便集成至应用程序提供语音识别服务。通过以下步骤,可以利用whisper.cpp提供的C++ API开发实例演示将本地音频文件转换为文本。项目结构包括关键文件和目录,如CMake...
最近发现了whisper这个语音生成字幕的本地工具,但是whisper速度不算快,然后在github上发现了whisper.cpp这个项目,执行速度更快,还可以在命令行使用,这样就可以自己定制了。 需要的东西 命令行工具 模型 脚本命令 命令行压缩包下载 命令行下载地址:https://github.com/Const-me/Whisper/releases ...
业界良心OpenAI开源的Whisper模型是开源语音转文字领域的执牛耳者,白璧微瑕之处在于无法通过苹果M芯片优化转录效率,Whisper.cpp 则是 Whisper 模型的 C/C++ 移植版本,它具有无依赖项、内存使用量低等特点,重要的是增加了 Core ML 支持,完美适配苹果M系列芯片。
业界良心OpenAI开源的Whisper模型是开源语音转文字领域的执牛耳者,白璧微瑕之处在于无法通过苹果M芯片优化转录效率,Whisper.cpp 则是 Whisper 模型的 C/C++ 移植版本,它具有无依赖项、内存使用量低等特点,重要的是增加了 Core ML 支持,完美适配苹果M系列芯片。
而由於目前深度學習領域主流的開發環境還是 Python,所以不意外地,OpenAI 提供的開發環境也是以 Python 為主。 不過,目前 Georgi Gerganov 也有開發出 C API 的 whisper.cpp 專案(GitHub),它提供了可以在不需要額外的函示庫的狀況下使用的 whisper API,對於 C / C++ 的開發者來說,應該是相當地友善的~(注意,...