Embedding模型作为RAG中检索召回的重要一环。我们团队在2024年8月底发布了中文Embedding模型Conan-Embedding-V1取得了CMTEB榜单SOTA,并在Huggingface开源。Conan-Embedding-v1已在开源社区获得了广泛关注,帮助工作者在搜索、推荐、RAG等许多领域上取得收益。近期团队在Embedding方向持续探索,发布
模型链接:https://huggingface.co/TencentBAC/Conan-embedding-v2 主要方法 【图2】Framework示意图。大语言模型(LLM)预训练、LLM监督微调(SFT)、嵌入弱监督训练以及嵌入监督训练 Conan-embedding-v2训练过程分为四个阶段,每个阶段在数据格式和损失函数上均有所不同。在大语言模型(LLM)训练阶段(第1和第2阶段),我们...
我们团队在2024年8月底发布了中文Embedding模型Conan-Embedding-V1取…现在huggingface也没看到权重文件,没...