34. LLMs中,量化权重和量化激活的区别是什么?35. AWQ量化的步骤是什么?36. 介绍一下GPipe推理框架37. 矩阵乘法如何做张量并行?38. 请简述下 PPO 算法流程, 它跟 TRPO 的区别是什么?39. 什么是检索增强生成 (RAG)?40. 目前主流的中文向量模型有哪些?41. 为什么 LLM 的知识更新很困难?42. RAG 和微调的...