作者基于DIN-SQL的实践: LLM在中文Text2SQL的实践作者基于DIN-SQL的优化V1.0: LLM在中文Text2SQL任务上的优化V1.0 二.问题 这期优化工作,主要围绕着业务中的三个问题来展开,相关的问题描述如下: 2.1 数据库描述问题 作者的实验的数据库Demo,为参考服务企业的业务功能,简化构建的中文数据集。该数据集对比开源的数...
对于Text2SQL的第一个子任务Schema Link抽取的prompt,作者采取了下列改进,从baseline到V3版本的instruction改进,先后加入了人设角色描述,任务数据源声明以及输出数据要求格式等信息,通过该操作,保障了LLM在数据输出结构上的对齐。 COT Prompt优化: 对于复杂的LLM推理任务,一般需要加入思维链(Chain-of-thought, COT)对LLM...
对于Text2SQL的第一个子任务Schema Link抽取的prompt,作者采取了下列改进,从baseline到V3版本的instruction改进,先后加入了人设角色描述,任务数据源声明以及输出数据要求格式等信息,通过该操作,保障了LLM在数据输出结构上的对齐。 COT Prompt优化: 对于复杂的LLM推理任务,一般需要加入思维链(Chain-of-thought, COT)对LLM...
本文是根据Text2SQL的任务做的深度优化,主要是从中文Text2SQL任务中发现的问题进行总结归纳,然后根据业务问题提出候选的解决方案,并给出作者在此解决方案上的效果。 基线任务 基线任务是实现了2023年ACL上State of the Art一篇文章,文中提到DIN-SQL模型在中文Text2SQL任务上对比其他开源模型效果要好。作者在复现该文...
原文地址:LLM在中文Text2SQL任务上的优化V1.0 - 知乎 (zhihu.com) 一. 前言 背景: 本文是根据上文提到的中文Text2SQL任务进行的优化,主要从中文Text2SQL任务中发现的问题进行总结归纳,提出候选的解决方案以及对应的效果等等,如果你在实践中也遇到了类似的问题,可以留言讨论。代码部分作者在整理,后续会统一放出来。
原文地址:LLM在中文Text2SQL任务上的优化V2.0 - 知乎 (zhihu.com) 一.前言 背景 本文是根据Text2SQL的任务做的深度优化,主要是从中文Text2SQL任务中发现的问题进行总结归纳,然后根据业务问题提出候选的解决方案,并给出作者在此解决方案上的效果。 基线任务 ...