简介 《大语言模型:原理与工程实践》用10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训...展开短评 打开App写短评 小狐狸爱吃刺身2024-12-24 15:21:26 PPT式的知识列举 0 TensorBanana2024-06-18 19:09:20 几天扫了遍 算是中文里还凑合...
《大语言模型:原理与工程实践》用10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。外,介绍...
总之,大语言模型是自然语言处理领域中的一种重要技术,其原理基于深度学习技术,通过对大量文本数据的训练,实现对自然语言的理解和生成。在工程实践方面,需要考虑数据准备、模型选择与训练、推理与部署等多个方面,采用合适的优化技术和算法,提高大语言模型的效果和性能。©...
大规模语言模型通常采用Transformer架构,这是一种高效的神经网络结构,通过多头注意力机制提高模型的并行处理能力和多任务学习能力。Transformer由编码器和解码器组成,编码器负责接收输入序列并学习其中的上下文信息,解码器则基于编码器的输出生成输出序列。 工程实践 数据准备与预训练 数据集准备:收集大量文本数据,包括书籍、...
大语言模型原理与工程实践:大语言模型的缩放定律 1. 背景介绍 1.1 人工智能的新时代 1.2 大语言模型的兴起 1.3 缩放定律的重要性 2. 核心概念与联系 2.1 缩放定律的基本思想 2.2 核心指标 2.3 缩放定律的数学表达 3. 核心算法原理具体操作步骤 3.1 实验设计 ...
大语言模型的评测是确保模型性能和应用适应性的关键环节。从基座模型到微调模型,再到行业模型和整体能力,每个阶段都需要精确的评测来指导模型的优化。基座模型的评测关注基础性能,而微调模型则侧重于对话能力和安全性。行业模型的评测则针对特定领域的能力,整体能力的评测则从宏观角度评估模型的通用性。在基座模型的评测...
大语言模型:原理与工程实践 杨青本书用10章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。此外...
作者知名:轩辕大模型负责人:真正的大语言模型实践者,拥有十亿、百亿、千亿等不同参数规模大语言模型的训练经验 系统性强:从数据处理的基础工作(如数据清洗与去重)讲起,逐步深入,探讨预训练、微调技术和强化对齐技术等核心技术环节。同时,书中对大语言模型评估策略及其应用技术架构,包括推理引导技术和动态交互技术,进行...
当当天美爱乐图书专营店在线销售正版《2册 大语言模型 原理与工程实践 杨青+大规模语言模型 从理论到实践 大模型部署微调 大语言模型预训练数据构建预训练技术微调书籍》。最新《2册 大语言模型 原理与工程实践 杨青+大规模语言模型 从理论到实践 大模型部署微调 大语言模型