可以看到,DB-GPT把架构抽象为7层,自下而上分别为: 运行环境:支持本地/云端&单机/分布式等部署方式。顺便一提,RAY是蚂蚁深度参与的一个开源项目,所以对RAY功能的支持应该非常完善。 训练层:由子项目DB-GPT-Hub提供。以LLM为基,包含多种数据集和微调方法的微调框架。 协议层:AWEL(智能体编排语言),专为大模型...
应用场景 私有领域问答和数据处理:在企业内部的特定领域,如金融、医疗等,可利用DB-GPT快速搭建问答系统,处理和分析相关数据。多数据源和生成式商业智能:整合多个数据源的数据,通过生成式商业智能技术,为企业提供全面的业务洞察和决策依据。多代理和插件:利用多代理框架和插件机制,实现复杂业务流程的自动化和拓展...
RAG(Retrieval Augmented Generation),RAG是当下落地实践最多,也是最迫切的领域,DB-GPT目前已经实现了一套基于RAG的框架,用户可以基于DB-GPT的RAG能力构建知识类应用。 GBI:生成式BI是DB-GPT项目的核心能力之一,为构建企业报表分析、业务洞察提供基础的数智化技术保障。 微调框架: 模型微调是任何一个企业在垂直、细分...
说明: 本教程中展示的智能体应用是基于Summarizer智能体进行构建的,Summarizer智能体是DB-GPT内置的智能体,相关代码实现见源码, 在实际使用中,可以根据具体的场景对相关代码做进一步的定制与优化。或者基于此案例自定义智能体。 数据对话助手 同理,可以根据类似的思路构建数据对话助手,数据对话助手是可以基于一个数据库进...
chat data 应用需要对用户输入的自然语言,将数据库对象的元数据拿出来,进行相似性检查。所以也需要一个服务于 chat data 应用的向量数据库,那这个提供服务的数据库,自然也落到了 OceanBase 头上,对应图中的 Vector 库。 也就是说,这次实验,不需要专门去另外搭建一个向量数据库,通过 DB-GPT,利用 OceanBase 的向量...
DB-GPT-Hub是一个利用LLMs实现Text-to-SQL解析的实验项目,主要包含数据集收集、数据预处理、模型选择与构建和微调权重等步骤,通过这一系列的处理可以在提高Text-to-SQL能力的同时降低模型训练成本,让更多的开发者参与到Text-to-SQL的准确度提升工作当中,最终实现基于数据库的自动问答能力,让用户可以通过自然语言描述...
conda create -n db-gpt python=3.10 conda activate db-gptcdDB-GPT pip install -e".[default]"--default-timeout=100 -i https://pypi.tuna.tsinghua.edu.cn/simplecp.env.template .env打包conda虚拟环境: conda create -n dbgpt_env_offline --clonedbgpt_env ...
🤖DB-GPT是一个开源的 AI 原生数据应用程序开发框架,具有AWEL(代理工作流表达式语言)和代理。 目的是通过开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架和优化、Multi-Agents框架协作、AWEL(代理工作流编排)等多种技术能力,构建大型模型领域的基础设施。
9月5日,在2024 Inclusion·外滩大会“从DATA for AI到AI for DATA”见解论坛上,由蚂蚁集团发起的,旨在提高数据库与大模型应用开发效率的“星辰智能社区”新发布了两个项目:AI原生数据应用开发框架DB-GPT新版本与向量索引库VSAG。 DB-GPT是一个开源的AI原生数据应用开发框架。在数据库领域,如何增强和大语言模型的...