Wenet是出门问问语音团队联合西工大语音实验室开源的一款面向工业落地应用的语音识别工具包,该工具用一套简洁的方案提供了语音识别从训练到部署的一条龙服务,其主要特点如下: 使用conformer网络结构和CTC/attention loss联合优化方法,具有业界一流的识别效果。 提供云上和端上直接部署的方案,最小化模型训练和产品落地...
近年来,端到端(E2E)自动语音识别(ASR)模型越来越受到关注,例如连接时序分类(CTC)[1, 2]、循环神经网络转换器(RNN-T)[3, 4, 5, 6]和基于注意力的编码器-解码器(AED)[7, 8, 9, 10, 11]。与传统的混合ASR框架相比,E2E模型最吸引人的优点是极其简化的训练过程。 最近的研究[12, 13, 14]也表明,E2E...
在过去 90 天内有多少活跃的代码提交者、代码审核者和 PR 提交者。 了解更多 代码提交频率 过去90天内平均每周代码提交次数。 了解更多 是否维护 过去90天内至少提交了一次代码的周百分比(单仓场景)。 在过去 30 天内至少有一次代码提交记录的的代码仓百分比(多仓场景)。 了解更多 代码提交关联 PR 的比率 在过...
git clone https://github.com/wenet-e2e/wekws.git Install Conda: please seehttps://docs.conda.io/en/latest/miniconda.html Create Conda env: conda create -n wekws python=3.10 conda activate wekws conda install conda-forge::sox Install torch and torchaudio, It's recommended to use torch 2....
wenet-e2e/wenetPublic NotificationsYou must be signed in to change notification settings Fork1.1k Star4.4k Code Issues11 Pull requests17 Actions Projects Security Insights Additional navigation options New issue Closed Describe the bug Server:
开源地址:https://github.com/wenet-e2e/wenet/ 今年6 月,WeNet 推出了 1.0.0 版本,该版本支持更多的数据集,解决了目前主流语音开源工具的痛点,且各项性能指标表现优异。 WeNet 使用业内前沿的深度学习模型结构 U2++ ,支持语言模型、endpoint、n-best、时间戳、提供数据量最大的中文和英文预训练模型等,在 Aishel...
开源地址:https://github.com/wenet-e2e/wenet/ 今年6 月,WeNet 推出了 1.0.0 版本,该版本支持更多的数据集,解决了目前主流语音开源工具的痛点,且各项性能指标表现优异。 WeNet 使用业内前沿的深度学习模型结构 U2++ ,支持语言模型、endpoint、n-best、时间戳、提供数据量最大的中文和英文预训练模型等,在 Aishel...
Wenet - 面向工业落地的E2E语音识别工具 WeNet步行街 感谢出门问问 的奉献! 1.系统设计 为解决落地问题,同时兼顾简单、高效、易于产品化等的准则,WeNet 做了如下图的三层系统设计。 第一层为 PyTorch 及其生态。 TorchScript 用于开发模型, Torchaudio 用于 on-the-fly 的特征提取, ...
Wenet源代码链接:https://github.com/wenet-e2e/wenet/blob/main/wenet/bin/train.py#L141 分布式数据并行封装模型 defmain(): ...ifdistributed:assert(torch.cuda.is_available())# cuda model is required for nn.parallel.DistributedDataParallelmodel.cuda() ...
墨菲安全对开源项目wenet-e2e/WeTextProcessing进行了软件成分分析,发现引入开源组件 3 个,相关许可证 1 类,其中存在漏洞的缺陷组件 0 个。 安全风险信息 目前暂未识别到安全风险,安全风险后续仍需持续关注。 许可证合规风险信息 项目中涉及到的许可证类型:1 种; ...