jonatasgrosman/wav2vec2-large-xlsr-53-english是基于 Wav2Vec2 XLSR 的流行的英语微调 CTC 模型,其他语言的模型也已得到训练。 如果您想无论如何使用模型的输出(仅从音频获取特征向量),请使用 aWav2Vec2FeatureExtractor代替Wav2Vec2Processor,并Wav2Vec2Model代替Wav2Vec2ForCTC。 (AWav2Vec2Processor结合...
2020 年推出的原始 wav2vec2 模型是在 960 小时的Librispeech数据集语音音频和约 53,200 小时的LibriVox数据集语音音频上进行预训练的。发布时,有两种模型大小可供选择:具有 9500 万个参数的BASE模型和具有 3.17 亿个参数的LARGE模型。 另一方面,XLS-R 已对来自 5 个数据集的多语言语音音频进行了预训练: ...
Wav2Vec2-Large-XLSR-53-Japanese模型在日语语音识别领域表现出色。它基于[facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53)进行微调,使用了Common Voice和东京大学Saruwatari-lab的日语语音语料库[JSUT](https://sites.google.com/site/shinnosuketakamichi/publicatio...
wav2vec2-large-xlsr-korean 是由 kresnik 推出的开源人工智能模型,主要应用于Audio,OpenCSG提供高速免费下载服务,支持模型推理、训练、部署全流程管理,助力AI开发者高效工作。
Wav2Vec2-Large-XLSR-53 The base model pretrained and fine-tuned on 960 hours of Librispeech on 16kHz sampled speech audio. When using the model make sure that your speech input is also sampled at 16Khz. More Info Meta AI Research post:Wav2vec 2.0: Learning the structure of speech from...
Wav2Vec2-Large-XLSR-Persian-ASR / README.mdLatest commit HistoryHistory File metadata and controls Preview Code Blame 3 lines (2 loc) · 170 Bytes Raw Wav2Vec2-Large-XLSR-Persian-ASR visit https://huggingface.co/lnxdx/Wav2Vec2-Large-XLSR-Persian-ShEMO...
Repository files navigation README GPL-3.0 license Wav2Vec2-Large-XLSR-Persian-ASR visit https://huggingface.co/lnxdx/Wav2Vec2-Large-XLSR-Persian-ShEMOAbout No description, website, or topics provided. Resources Readme License GPL-3.0 license Activity Stars 1 star Watchers 1 watching ...
wav2vec2-xls-r-300m-en-to-15 是由 AIWizards 推出的开源人工智能模型,主要应用于Automatic-Speech-Recognition,OpenCSG提供高速免费下载服务,支持模型推理、训练、部署全流程管理,助力AI开发者高效工作。
Wav2Vec2 XLS-R for Finnish ASR模型是针对芬兰语自动语音识别任务的优化版本。它基于facebook/wav2vec2-xls-r-1b模型进行微调,使用了275.6小时的芬兰语转录语音数据进行训练,并包含用于解码阶段的芬兰语KenLM语言模型。该模型在Common Voice 7.0芬兰语测试集上实现了4.09%的词错误率(WER)和0.88%的字符错误率(CER...
基于XLSR-Wav2vec 2.0框架的阿尔茨海默症自动化筛查预训练模型系统是由王心怡著作的软件著作,该软件著作登记号为:2024SR0753090,属于分类,想要查询更多关于基于XLSR-Wav2vec 2.0框架的阿尔茨海默症自动化筛查预训练模型系统著作的著作权信息就到天眼查官网!