多端推理适配-Qwen.cpp和LLaMa.cpp转化模型为gguf或者ggml,并结合Xinference在本地笔记本部署。 LLM的应用场景,RAG&Agent 使用llama index和langchain打造基于本地知识库的ChatBot 多模态大模型推理 LLM的推理流程: 多模态的LLM的原理: 代码演示: 使用ModelScope NoteBook完成语言大模型,视觉大模型,音频大模型的推...