【新智元导读】就在刚刚,法国AI初创公司Mistral发布了自家首款代码生成模型Codestral。不仅支持32K长上下文窗口以及80多种编程语言,而且还用22B的参数量取得了与70B的Llama 3相近的性能。目前,已经开放API与IDE插件供用户使用。 真正Open的AI公司Mistral又低调上新了。 这次,他们发布了首款代码生成模型Codestral,支持80...
• 优化的上下文长度:从32K提高至128K,更贴合人类使用需求。 其在知识类任务、长文本测评、算法类代码场景、数学竞赛和中文能力等方面都有出色表现。例如,在知识类任务上接近当前表现最好的模型Claude-3.5-Sonnet-1022;在算法类代码场景领先于市面上已有的全部非o1类模型;在美国数学竞赛和全国高中数学联赛上大幅超过...
在近年来大模型发展迅速的潮流中,许多模型的输出声称可以达到惊人的32K tokens。然而,近期陈丹琦团队提出的新基准测试工具LONGPROC却揭示了这一宣传背后的真相:大多数模型的实际输出远低于标称长度。 这项研究引起了广泛关注,尤其是当结果显示连GPT-4o等行业顶尖模型在复杂长文生成任务中表现不佳时,令人大跌眼镜。尽管...