在Arena-Hard-Auto排行榜上,DeepSeek-Coder-v2超过了Yi-large、Claude3-Opus、GLM-4 和Qwen2-72B。 同时,DeepSeek-Coder-v2还具有良好的通用性能,在推理和中英通用能力上位列国内第一梯队。 当时甚至有网友怒赞: DeepSeek-Coder-v2目前位居Aider代码编辑排行榜榜首(仅用了4天),领先于GPT
第一时间充了 50 块钱 测试 minimax 模型。1. 编程能力,和 deepseek v3 和 sonnet 3.5 还有差距,目前没有进入及格线。我在 auto-coder 中测试目前连生成editblock 这种最基础的能力还不稳定。2. RAG 方向上,我测试了 auto-coder.rag 的图文内容回答,目前完美支持,和 deepseek v3 接近, 超过豆包128k 。但...
在Arena-Hard-Auto排行榜上,DeepSeek-Coder-v2超过了Yi-large、Claude3-Opus、GLM-4 和Qwen2-72B。 同时,DeepSeek-Coder-v2还具有良好的通用性能,在推理和中英通用能力上位列国内第一梯队。 当时甚至有网友怒赞: DeepSeek-Coder-v2目前位居Aider代码编辑排行榜榜首(仅用了4天),领先于GPT-4o和Opus。 它的基...