上篇介绍了构建知识库的大体流程和一些优化经验细节,但并没有结合一个具体的场景给出更细节的实战经验以及相关的一些 benchmark 等,所以本文将会具体切入到一个场景进行具体讨论。 目标场景:对于PubMed医疗学术数据中的 1w 篇文章进行知识库构建,实现快速的注入和查询速度。 主要讨论...
我们《基于大语言模型知识问答应用落地实践》系列博客前 4 篇已经介绍了知识库构建和召回调优方面的实践经验,随着 RAG 项目的逐渐丰富和成熟,越来越多的工作会深入到各种细节的打磨,例如 Prompt 模板调优,更换更新的模型,各类阈值或者参数的调整等。然而 RAG 项目普遍缺乏比较客观的、系统化的测试工具来衡量性能和质量...
上篇介绍了构建知识库的大体流程和一些优化经验细节,但并没有结合一个具体的场景给出更细节的实战经验以及相关的一些 benchmark 等,所以本文将会具体切入到一个场景进行具体讨论。 目标场景:对于PubMed医疗学术数据中的 1w 篇文章进行知识库构建,实现快速的注入和查询速度。...
我们《基于大语言模型知识问答应用落地实践》系列博客前 4 篇已经介绍了知识库构建和召回调优方面的实践经验,随着 RAG 项目的逐渐丰富和成熟,越来越多的工作会深入到各种细节的打磨,例如 Prompt 模板调优,更换更新的模型,各类阈值或者参数的调整等。然而 RAG 项目普遍缺乏比较客观的、系统化的测试工具来衡量性能和质量...