在语音识别领域,中文识别的技术发展一直备受关注。近日,小红书的 FireRed 团队发布了一个全新的开源语音识别模型 ——FireRedASR。这个基于大模型的语音识别系统在多个标准测试集上取得了优异的成绩,标志着中文语音识别技术的一次重大突破。FireRedASR 的核心指标是字错误率(CER),该指标越低,表示模型的识别效果越...
FireRedASR 是小红书开源的工业级自动语音识别模型,支持普通话、中文方言和英语。该模型在普通话 ASR 基准测试中达到了新的最佳水平(SOTA),并在歌词识别方面表现出色。核心功能:FireRedASR 包含两个版本,FireRedASR-LLM 采用 Encoder-Adapter-LLM 框架,专注于极致的语音识别精度;FireRedASR-AED 采用基于注意力的...
近日,小红书 FireRed 团队正式发布并开源了基于大模型的语音识别模型 ——FireRedASR,在语音识别领域带来新突破。 在业界广泛采用的中文普通话公开测试集上,FireRedASR 凭借卓越的性能取得了新 SOTA!FireRedASR 在字错误率(CER)这一核心技术指标上,对比此前的 SOTASeed-ASR,错误率相对降低 8.4%,充分体现了团队在语...
FireRedASR-AED(右下):基于经典的 Attention-based Encoder-Decoder 架构,FireRedASR-AED 通过扩展参数至 1.1B,成功平衡了 ASR 语音识别的高准确率与推理效率。 实验及结果 下图是 FireRedASR 和其他 ASR 大模型的对比,在业界常用的中文普通话公开测试集上,FireRedASR-LLM(8.3B 参数量)取得了最优 CER 3.05%、...
FireRedASR 的技术原理 FireRedASR-LLM FireRedASR-AED 如何运行 FireRedASR 1. 设置环境 2. 快速启动 3. 命令行使用 4. Python 使用 资源 ️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! 大家...
1、小红书开源 FireRedASR 语音识别模型,取得中文语音识别新突破 近日,小红书 FireRed 团队开源了基于大模型的语音识别模型 FireRedASR,该模型在中文普通话语音识别领域取得了新的 SOTA(State of the Art,最佳性能)。FireRedASR 包含两种核心结构:FireRedASR-LLM 和 FireRedASR-AED,分别针对极致精度和高效推理需求设...
1、小红书开源 FireRedASR 语音识别模型,取得中文语音识别新突破 近日,小红书 FireRed 团队开源了基于大模型的语音识别模型 FireRedASR,该模型在中文普通话语音识别领域取得了新的 SOTA(State of the Art,最佳性能)。FireRedASR 包含两种核心结构:FireRedASR-LLM 和 FireRedASR-AED,分别针对极致精度和高效推理需求设...
近日,小红书 FireRed 团队正式发布并开源了基于大模型的语音识别模型 ——FireRedASR,在语音识别领域带来新突破。 语音识别(ASR,Automatic Speech Recognition)是一种将语音转化为文字的技术,被广泛应用于智能语音交互和多媒体内容理解领域,例如语音助手、语音输入、视频字幕等场景。衡量中文 ASR 性能的主要指标是字错误...
> ### 摘要 > 小红书的FireRed团队近日宣布了一项重大进展,发布了名为FireRedASR的新型语音识别模型,并将其代码开源。这款基于大型语言模型的FireRedASR在中文语音识别领域达到了新的最佳性能(SOTA),标志着该技术的一个重要突破。这一成果不仅提升了中文语音识别的准确性,还为开发者提供了宝贵的资源,推动了整个行业...
FireRedASR 的主要功能 高精度语音识别:FireRedASR 包含两个版本,FireRedASR-LLM 采用 Encoder-Adapter-LLM 框架,专注于极致的语音识别精度;FireRedASR-AED 采用基于注意力的编码器-解码器架构,平衡了高准确率与推理效率。 高效推理:FireRedASR-AED 参数量为 1.1B,平衡了高准确率与推理效率,适用于多种应用场景。