11月6日消息,界面新闻获悉,成立仅5个月后,李开复的大模型初创公司零一万物发布了其首个模型Yi-34B,这是一个双语基础模型,训练参数达到340亿,显著小于其他开源模型,如Falcon-180B和Meta LlaMa2-70B,根据Hugging Face的排名,Yi-34B在预训练LLM模型中名列前茅。据李开复所述,Yi-34B可以处理上下文窗口长度达...
目前最具公信力的 HuggingFace 榜单中,包括 Yi-34B 在内,排在它前面的模型只有 26 个,但是其中 48% (14个)都是 Yi-34B 和 Yi-34B 200K 的变体模型,其中第一名是来自社区用户 fblgit 的“LLaMa Yi 34B” ,比之前因为数据污染而被取消榜单资格的 TigerBot 的 70B 的效果还要好一些,千问憋出的大招 QWen...
模型描述: 这个仓库包含了Eric Hartford的Dolphin 2.2 Yi 34B 200K模型的GGUF格式文件。 GGUF格式简介 GGUF是由llama.cpp团队在2023年8月21日引入的新格式,旨在替代不再支持的GGML格式。 支持GGUF的客户端和库包括llama.cpp、text-generation-webui、KoboldCpp、GPT4All、LM Studio、LoLLMS Web UI、Faraday.dev...
Yi-34B模型特别之处在于它拥有全球最长的200K上下文窗口,能够处理40万汉字的超长文本输入,这在语言模型中是非常重要的,因为它对于理解和生成与特定上下文相关的文本至关重要。 Yi大模型的命名来自“一”的拼音“Yi”,其中的“Y”上下颠倒,形同汉字的“人”结合AI里的“i”,代表Human + AI,强调以人为本的精神,...
请问下怎么推理Yi-34B-200k的模型?#208 Closed taishan1994 opened this issue Nov 29, 2023· 3 comments Commentstaishan1994 commented Nov 29, 2023 怎么样推理才能达到200k的长度,如果GPU资源充足的情况下? 👍 1 Contributor findmyway commented Dec 9, 2023 请问做过哪些尝试?遇到了什么具体的问题么?
Yi-34B-200K / pytorch_model.bin.index.json pytorch_model.bin.index.json 48.91 KB 一键复制 编辑 原始数据 按行查看 历史 liam01ai 提交于 12个月前 . update model 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667...
李开复的AI公司零一万物估值超10亿美元 | 零一万物发布了首款开源大模型Yi系列,包括Yi-34B和Yi-6B。 Yi-34B在Hugging Face英文测试榜单中位列第一,在C-Eval中文能力排行榜中超越所有开源模型。200K上下文窗口,能处理40万汉字超长文本输入。能一次处理两本《三体》小说、理解超过 1000 页的 PDF 文档。
零一万物Yi系列开源模型性能优异 | 零一万物最新开源的Yi系列大模型,同步发布在国内的链接社区,本次开源的模型包括6B和34B两个版本,以及对应的200K上下文的版本。其中Yi-34B击败了LLaMA2-70B、Falcon-icon180B等大参数规模的模型。在 MMLU、BBH等反映模型综合能力的评测集上,Yi-34B 也全部胜出,取得了在各项测试任务...
如何微调开源Yi-34B-200K成为Open LLM排名前三模型 #小工蚁 - 小工蚁于20240110发布在抖音,已经收获了22.1万个喜欢,来抖音,记录美好生活!
李开复团队开源Yi-34B-200K 340亿支持200K上下文大语言模型#小工蚁 277 15 134 21 发布时间:2023-11-09 08:18 全部评论 大家都在搜: going ... 是不是改名模型啊[看]。贾扬清说的是谁啊 2月前·广东 0 萌宠萌萌哒 ... 别总是对比参数,测测实际效果 ...