BPO对模型比较可解释,通过直接比较优化前后提示,可以分析优化的策略 BPO适用于各类LLM,包括开源和API访问的模型,且优化后的提示对模型无关 应用 Hugging Face 只需要修改上图中“text”的内容,print(resp)输出的是优化后的promptA^{'} 基本方法 Black-Box Prompt整体框架图 方法 利用大模型来纠偏: Step1:Feedback...
先拿一个好的prompt和一个坏的prompt 然后告知大模型,让大模型比较两者的区别,并且告知操作者,该怎样写更好,然后再给出一个原始的prompt让大模型依据它先前的判断进行修改,这样就得到一个原始prompt和大模型优化后prompt,然后就可以拿这个原始的作为输入,优化后的作为输出,训练一个prompt修改器。 以上,就是如果让...