Inexpensive Domain Adaptation of Pretrained Language Models: A Case Study on Biomedical Named Entity Recognition 04月08日 12:22 上传 · 自然语言 0.32MB 0 Windowing Models for Abstractive Summarization of Long Texts 04月08日 12:22 上传 · 自然语言 0.62MB 0 KorNLI and KorSTS: New Be...
Subjects: Computation and Language (cs.CL); Artificial Intelligence (cs.AI) Cite as: arXiv:2402.18041 [cs.CL] 动机 大型语言模型(LLM)的发展取得了显著进展,而数据集在这一进程中扮演着关键角色。 然而,对于LLM数据集缺乏全面概述和彻底分析,需要填补这一空白。 方法 本调查从五个角度整理和分类了LLM数据...
arXiv - CS - Computation and Language Pub Date : 2021-09-24 , DOI: arxiv-2109.11763 Elena Sofia Ruzzetti, Leonardo Ranaldi, Michele Mastromattei, Francesca Fallucchi, Fabio Massimo Zanzotto 词嵌入是功能强大的词典,可以轻松捕获语言变体。然而,这些词典无法解释生僻词,令人惊讶的是,这些词经常被传统...
arXiv - CS - Computation and Language Pub Date : 2021-10-15 , DOI: arxiv-2110.08243 Chenxu Hu, Qiao Tian, Tingle Li, Yuping Wang, Yuxuan Wang, Hang Zhao 配音是重新录制演员对话的后期制作过程,广泛用于电影制作和视频制作。它通常由专业配音演员手动执行,他们以适当的韵律朗读台词,并与预先录制的...
Subjects: Computer Vision and Pattern Recognition (cs.CV); Computation and Language (cs.CL); Audio and Speech Processing (eess.AS); Image and Video Processing (eess.IV) Cite as: arXiv:2402.15151 [cs.CV] 动机 视觉语音处理中的唇部运动具有模糊性质,需要上下文建模能力。 同音异义词需要通过上下文...
摘要:This work introduces an efficient method to scale Transformer-based Large Language Models (LLMs) to infinitely long inputs with bounded memory and computation. A key component in our proposed approach is a new attention technique dubbed Infini-attention. The Infini-attention incorporates a ...
从arXiv搬运的2020年03月26日的Computation and Language领域论文合集打包18篇 论文 | 0人 订阅 | 0人 下载 订阅 The Medical Scribe: Corpus Development and Model Performance Analyses 03月26日 12:27 上传 · 自然语言 0.77MB 1 Meta-CoTGAN: A Meta Cooperative Training Paradigm for Improving ...
端到端的语音到文本翻译~(E2E-ST)由于其错误传播更少、延迟更低和参数更少的潜力而变得越来越流行。给定三元组训练语料$\langle语音、转录、翻译\rangle$,传统的高质量E2E-ST系统利用$\langle语音、转录\rangle$对来预训练模型,然后利用$\语言语音,翻译\rangle$ 对以进一步优化它。然而,这个过程在每个阶段只涉及...
尽管该领域取得了进展,但语音识别仍然被认为是困难的,尤其是对于缺乏可用数据的语言,如巴西葡萄牙语。从这个意义上说,这项工作展示了一个公共自动语音识别系统的开发,该系统仅使用开放的可用音频数据,对 Wav2vec 2.0 XLSR-53 模型进行了微调,该模型在巴西葡萄牙语数据上以多种语言进行了预训练。最终模型的字错误率...
However, fine-tuning methods require independent training for every model, leading to huge computation and memory overheads. In this paper, we propose a novel setting where we aim to improve the performance of diverse MLLMs with a group of shared parameters optimized for a downstream task. To ...