在经典的RAG模型中,检索查询要么是来自数据集的原始查询,要么是由黑盒生成直接确定的。但是,输入查询语句与查询真正需要的知识之间不可避免地存在差距。这限制了检索的性能。 针对这个问题,作者提出了Rewrite-Retrieve-Read框架。在该框架中,并非直接将原始的query输入给检索器,而是在检索器前面添加了一个重写输入的步骤...
解决方案,Rewrite-Retrieve-Read (RRR) 框架: 增加一个 Rewrite 步骤,用 LLM 把用户的问题重新写一遍来检索知识 RRR 流程: Rewrite:让 LLM 根据原始输入 x 生成新的 x' 以检索所需的知识 Retrieve: 根据 x' 获取相关的上下文 doc Read:让 LLM 结合 doc 和 x,输出 y^ (训练 Rewriter 模型的内容在这里忽...