3. peft方法介绍 4. LLM SFT的数据集规模,数据配比 5. 常见的LLM有哪些,做了哪些改进? 6. 位置编码:Bert,LLAMA的位置编码 7. 激活函数概念,ReLU, SiLU 8. Transformer推理加速技术?vLLM等 9. deepseek了解吗?讲一个创新点 10. FlashAttention原理 手撕1. 合并区间 #大模型#面经#算法#春招#暑假实习...