再以es索引的方式被写入到向量库。而在第二阶段,也就是对外提供服务的阶段,我们会将用户的问题调用嵌入接口生成它的词嵌入向量,然后通过向量数据库的文本相似度匹配获取到近似的回答,比如提问“青椒炒肉时我的盐应该放多少”。向量库相似的文本里如果包含了和该烹饪有关的文本会返回1到多条回答。接着我们在后端构...
而向量数据库则是一种专门用来存储和检索向量数据的数据库,它可以高效地对大量的向量进行相似性搜索。 目标:如何利用C#,词嵌入技术和向量数据库,使LLM实现长期记忆,以落地私域问答机器人。基于以上目的,我们需要完成以下几个步骤,从而实现将大语言模型与私域知识相结合来落地问答机器人。 一、私域知识的构建与词嵌入...
大模型检索增强生成(RAG)是一种结合了大型语言模型(LLM)和向量数据库(VecDB)的新型解决方案,旨在解决LLM在处理和集成来自外部数据库的大量动态数据时面临的挑战。RAG的核心思想是利用VecDB作为LLM的外部知识库,以提高数据检索的效率和准确性,同时降低成本。
因此我们需要探索一种方法让LLM能够获取并利用长期记忆来提高问答机器人的效果。 这里我们主要是用到了词嵌入向量表示以及对应的向量数据库持久化存储,并且通过相似度计算得到长期记忆用于模型对特定领域的特定问题进行作答。词嵌入是自然语言处理(NLP)中的一个重要概念,它是将文本数据转换成数值型的向量,使得机器可以理...