高效内存管理:vLLM采用PagedAttention技术,能够更高效地管理注意力键和值的内存,从而减少内存使用2。 高性能计算:vLLM使用CUDA/HIP图实现快速执行模型,支持量化技术如GPTQ、AWQ、INT4、INT8和FP8,进一步优化了计算效率3。 灵活性和易用性:vLLM无缝集成流行的HuggingFace模型,支持高吞...
Ollama:单次推理速度快,但并发处理能力较弱。它通过模型量化和底层优化减少显存占用,适合处理少量请求12。 vLLM:高吞吐量,支持动态批处理和千级并发请求。它利用PagedAttention技术提高并发效率,适合处理大量并发请求13。 硬件要求 Ollama:支持CPU和GPU,显存占用低,默认使用量化模型(如i...
46.6万 182 09:30 App 4K | 本地部署DeepSeek-R1后,搭建自己的知识库 41.6万 1136 37:40 App 【知识科普】【纯本地化搭建】【不本地也行】DeepSeek + RAGFlow 构建个人知识库 129.1万 2175 08:26 百万播放 App DeepSeek上手第一步!5个新手必学的「人性化」使用技巧 18.1万 356 17:49 App 【喂...
InternVL:媲美 GPT-4o 的开源 VLLM3.专为新手准备的首个议题:开源贡献机会指南4.无名的主页:个性化我的主页5.PrimeVue:面向 Vue 的开源 UI 组件库6.RuoYi-Vue3:基于SpringBoot和Vue3的权限管理系统7.Piped:以隐私为优先的 YouTube 替代前端8.Bruno:一款创新的 API 客户端9.Langflow:低代码多模态 AI...
App 【知识科普】【纯本地化搭建】【不本地也行】DeepSeek + RAGFlow 构建个人知识库 36.6万 506 04:24:37 App 【清华大学公开课】B站最好的DeepSeek教程!清华大佬终于把DeepSeek给讲明白了,全程干货满满,新手小白也能轻松玩转AI!(附安装包+使用技巧)还...
RAGFlow is an open-source RAG (Retrieval-Augmented Generation) engine based on deep document understanding. - Update docs for v0.14.0 (#3625) · github-llm/ragflow@e5af18d
Langflow 是一款低代码应用程序构建器,用于构建基于 RAG 和多模态 AI 的应用程序。它基于 Python,并且不依赖于任何模型、API 或数据库。 项目作用 Langflow 采用可视化 IDE,允许用户通过拖放操作构建和测试工作流。它还包括一个游乐场,用于立即测试和迭代工作流。Langflow 还提供多代理编...
RAGFlow: running RAGFlow (an open-source RAG engine) with ipex-llm LangChain-Chatchat: running LangChain-Chatchat (Knowledge Base QA using RAG pipeline) with ipex-llm Coding copilot: running Continue (coding copilot in VSCode) with ipex-llm Open WebUI: running Open WebUI with ipex-llm ...
(DtCioCCnMMp)中.oiWn,th,当eit电n w感oipll器eor电apte流inrga减tei小n i至nDC零cMo时n,t,iinnu低dou端ucst开orc关ocnu将drr断uecn开ttio,ins 这ma将in引ta致in电ed感to器a电n流av发e生rag谐e振v.alu尽e管eq处u于alinDgCIMou中t .,In但D允C许M电th流e 稍low稍-s变id至e负sw值it...
翻遍整个B站,这绝对是2025讲的最好的DeepSeek本地部署+构建企业级私有知识库实战教程,让你少走99%的弯路! 49.4万 1296 37:40 App 【知识科普】【纯本地化搭建】【不本地也行】DeepSeek + RAGFlow 构建个人知识库 49.9万 189 09:30 App 4K | 本地部署DeepSeek-R1后,搭建自己的知识库 2896 1 34:52...