34. LLMs中,量化权重和量化激活的区别是什么?35. AWQ量化的步骤是什么?36. 介绍一下GPipe推理框架37. 矩阵乘法如何做张量并行?38. 请简述下 PPO 算法流程, 它跟 TRPO 的区别是什么?39. 什么是检索增强生成 (RAG)?40. 目前主流的中文向量模型有哪些?41. 为什么 LLM 的知识更新很困难?42. RAG 和微调的区别是什么?4
大语言模型(LLMs) 基本概念 大语言模型(如GPT系列、BERT系列等)主要用于处理文本数据,通过学习大量的文本信息,来理解语言的深层次结构和含义。它们通常基于Transformer架构,能够生成连贯的文本、完成翻译、摘要、问答等多种自然语言处理任务。 工作原理 Transformer架构:Transformer是一种基于自注意力机制的模型架构,它允许...