DB-GPT-Hub是一个旨在利用大规语言模型(LLMs)来改进文本到SQL解析的项目。该项目包括了数据集收集、数据预处理、模型选择与构建以及微调权重等。能够显著提高文本到SQL能力,并减少模型训练成本,从而使更多开发人员能够参与提高准确性的工作中。最终目标是实现基于数据库的自动问答功能,使用户可以使用自然语言描述来执行...
若是多卡的GPU(量化)使用以下设置: --deepspeed dbgpt_hub/configs/ds_config.json一定要改成ds_config.json,如果是默认值,会报错。 目前采用的是QLora的微调方式,如果要改成Lora的微调方式,则将 --quantization_bit 4注释掉即可。 deepspeed --num_gpus 4 dbgpt_hub/train/sft_train.py \ --deepspeed db...
text2sql任务的微调框架和基准对比 | NL2SQL之DB-GPT-Hub<详解篇>:text2sql任务的微调框架和基准对比随着生成式人工智能(Artificial Intelligence Generated Content,简写为 AIGC)时代的到来,使用大规模预训练语言模型(LLM)来进行 text2sql 任务的 sql 生成也越来越常见。基于 LLM 的 text2SQL 方法通常分为两种:...