《ChatGPT原理与架构:大模型的预训练、迁移和中间件编程》是2023年机械工业出版社出版的图书。内容简介 这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训...
《ChatGPT原理与应用开发》是由郝少春、黄玉琳、易华挥著,人民邮电出版社于2024年出版的 图书 。内容简介 随着ChatGPT的出现,大语言模型的能力得到了业内外的认可,新的商业模式不断涌现,旧的设计和实现都将重构。本书主要介绍基于ChatGPT开发算法相关的应用或服务,侧重于介绍与自然语言处理相关的常见任务和应用,...
ChatGPT的工作原理和算法实现 基于Transformer架构的一系列预训练语言模型的原理 强化学习的基础知识 提示学习与大模型涌现出的上下文学习、思维链 大模型的训练方法及常见的分布式训练框架 基于人工反馈的强化学习整体框架 从零搭建类ChatGPT模型,模拟完整的ChatGPT训练过程 本书集理论、实战和产业应用于一体,提供...