这几个指标都是RAGAS toolkit提供的套件,可以直接使用但需要具备LLM能力(OpenAI或开源),这几个指标都依赖LLM,所以prompt具有一定定制化空间(比如想让评价结果具备事实性,可通过调整prompt实现),整体来看很适合现阶段RAG框架的综合评估,几个关键点都覆盖到了。 Reference RAGAS document RAGAS: Automated Evaluation of Ret...