6月27日凌晨,全球著名开源平台huggingface(笑脸)的联合创始人兼首席执行官Clem在社交平台宣布,阿里最新开源的Qwen2-72B指令微调版本,成为开源模型排行榜第一名。他表示,为了提供全新的开源大模型排行榜,使用了300块H100对目前全球100多个主流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3等,在BBH、MUSR、...
研究人员一共挑选了12个开源多模态大模型,给评测标准做个“示范”。感知类总榜单,是将各项感知任务综合起来的总评分,显示是BLIP-2最高:认知类总榜单,则是各种涉及认知类任务的榜单,加起来是MiniGPT-4最高:评测结果发现,BLIP-2和InstructBLIP在这两个榜单中都保持在前三,属实是当前开源多模态大模型的“顶...
1月30日,大模型开源开放评测体系司南(OpenCompass2.0)揭晓了2023年度大模型评测榜单。对过去一年来主流大模型全面评测诊断后,结果显示,GPT-4-Turbo在各项评测中均获最佳表现,国内厂商近期发布的模型紧随其后,包括智谱清言GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0。评测是大模型的指挥棒和指南针,OpenCompass...
12月8日消息,全球最大的开源大模型社区HuggingFace日前公布了最新的开源大模型排行榜,阿里云通义千问力压Llama2等国内外开源大模型登顶榜首。通义千问-72B登顶HuggingFace的Open LLM Leaderboard HuggingFace的开源大模型排行榜(Open LLM Leaderboard)是目前大模型领域最具权威性的榜单,收录了全球上百个开源大模型,...
Falcon是这个列表上的第一个开源大模型,它的排名超过了迄今为止发布的所有开源模型,包括LLaMA、StableLM、MPT等等。它是由阿联酋技术创新研究所开发的。关于Falcon最好的一点是,它已经使用Apache 2.0许可证开源,这意味着您可以将该模型用于商业目的,也没有版税或限制。到目前为止,阿联酋技术创新研究所已经发布了...
△Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜,Yi-34B高居榜首(2023年11月5日)聚焦到中文能力方面,Yi-34B在C-Eval中文能力能力排行榜上超越所有开源模型。同样开源的Yi-6B也超过了同规模所有开源模型。△C-Eval 排行榜:公开访问的模型,Yi-34B 全球第一(2023年11月5日)在CMMLU、E-...
在全新的评价系统下,GPT-4依然稳居第一,而GPT-3.5则成功夺回了第二的宝座。Anthropic的两款Claude模型紧随其后,排在了第三和第四的位置上。UC伯克利最新发布的330亿参数Vicuna进军第五,小幅领先微软华人团队开源的300亿参数WizardLM模型。 增强版LLM排行榜 ...
6月27日凌晨,全球著名开源平台Hugging Face的联合创始人兼首席执行官在社交平台表示,在新一轮的全球开源大模型评估中,阿里开源的Qwen2-72B力压科技兼社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral,荣登开源大模型排行榜(Open LLM Leaderboard)榜首。Hugging Face的开源大模型排行榜是目前大模型领域最具...