faster-whisper-GUI 作为一款基于 PySide6 开发的图形用户界面软件,为 faster-whisper 和 whisperX 这两个强大的语音识别模型提供了一个直观、易用的操作平台。本文将深入探讨 faster-whisper-GUI 的特性、功能和使用方法,帮助用户充分发挥其在语音转写领域的潜力。 faster-whisper-GUI 概述 faster-whisper-GUI 是一...
而faster-whisper-GUI增添了更多的特性,可以快速把音视频文件转成srt/txt/smi/vtt/lrc,支持Demucs、FastWhiper和whisperX、VAD-model这些技术,简单来说,支持的可调整的选项要比之前推荐的工具更多一点。由于这类工具离线处理的特点,所以体积都比较大,faster-whisper-GUI的本体有1.6个G,安装完之后的占用又是6...
而faster-whisper-GUI增添了更多的特性,可以快速把音视频文件转成srt/txt/smi/vtt/lrc,支持Demucs、FastWhiper和whisperX、VAD-model这些技术,简单来说,支持的可调整的选项要比之前推荐的工具更多一点。 由于这类工具离线处理的特点,所以体积都比较大,faster-whisper-GUI的本体有1.6个G,安装完之后的占用又是6个多G...
而faster-whisper-GUI增添了更多的特性,可以快速把音视频文件转成srt/txt/smi/vtt/lrc,支持Demucs、FastWhiper和whisperX、VAD-model这些技术,简单来说,支持的可调整的选项要比之前推荐的工具更多一点。 由于这类工具离线处理的特点,所以体积都比较大,faster-whisper-GUI的本体有1.6个G,安装完之后的占用又是6个多G...
由于这类工具离线处理的特点,所以体积都比较大,faster-whisper-GUI的本体有1.6个G,安装完之后的占用又是6个多G,而且还不包括后续添加模型的大小,建议大家体验的时候,装在空间富裕的盘里。 如果是分离音频和背景音乐的话,直接把文件丢进来就行,试了一下效果还不错,也可以单独设置输出的内容。 其他的就需要加载一...
Faster Whisper-GUI 是一款基于 Faster Whisper 模型开发的语音转文字工具,它支持多种格式的音频和视频文件转录为高精度的文字内容。无论你是内容创作者、教育工作者,还是媒体从业者,这款工具都能让你省时省力,快速完成转录工作。#软件亮点:1. 本地运行,摆脱云端依赖 Faster Whisper-GUI 支持在本地运行,无需...
训练模型一般要用到大量的算力,还要放在专门的服务器上,而训练好的成果,就像是炼制好的丹药,在精简和用户的设备上也能跑,今天我们要说的,是在音频识别上面一款融合了众多优点的模型启动器——faster-whisper-GUI。 听到Whisper,这个大家可能有点熟悉,这是OpenAI做的一个神经网络模型,可以在本地实时语音转文字,用来...
faster-whisper-GUI 概述 faster-whisper-GUI 是一个开源项目,旨在为用户提供一个便捷的图形界面来使用 faster-whisper 和 whisperX 模型进行语音转写。该软件集成了多项先进功能,包括音频和视频文件的转写、VAD(语音活动检测)模型和 whisper 模型的参数调整、批量处理、Demucs 音频分离等。
15 changes: 8 additions & 7 deletions 15 fasterWhisperGUIConfig.json Original file line numberDiff line numberDiff line change @@ -8,12 +8,12 @@ "model_param": { "localModel": true, "onlineModel": false, "model_path": "F:/WhisperModels/faster-whisper/whisper-large-v2-ct2-32", ...
训练模型一般要用到大量的算力,还要放在专门的服务器上,而训练好的成果,就像是炼制好的丹药,在精简和用户的设备上也能跑,今天我们要说的,是在音频识别上面一款融合了众多优点的模型启动器——faster-whisper-GUI。 听到Whisper,这个大家可能有点熟悉,这是OpenAI做的一个神经网络模型,可以在本地实时语音转文字,用来...