DeepSeek LLM:2024 年 1 月 5 日发布,包含 670 亿参数,在 2 万亿 token 的数据集上训练,涵盖中英文。其 67B base 在推理、编码等方面超越 Llama2 70B base,67B chat 在编码、数学方面出色,中文表现超越 GPT-3.5。DeepSeek Coder:2024 年 1 月 25 日发布,由系列代码语言模型组成,在 2 万亿 token 上...