CodeFuse-DeepSeek-33b模型在代码能力方面表现卓越,在HumanEval和MBPP测试集上的pass@1指标值分别为78.65%和71%,平均达到74.83%。在多语言代码能力评测集HumanEval-X上,该模型的平均pass@1指标值为67.07%,在多种语言上的表现均超过了先前的模型。此外,CodeFuse模型还在NLP通用能力方面展现了强大的性能,在...
CodeFuse-DeepSeek-33b模型在代码能力方面表现卓越,在HumanEval和MBPP测试集上的pass@1指标值分别为78.65%和71%,平均达到74.83%。在多语言代码能力评测集HumanEval-X上,该模型的平均pass@1指标值为67.07%,在多种语言上的表现均超过了先前的模型。此外,CodeFuse模型还在NLP通用能力方面展现了强大的性能,在包括语言能...
codefuse deepseek coder 33b 编程能力测试 大题 测试了几十道题,基本上都是一次性通过,真的好强。。。 源题库链接: https://blog.csdn.net/qq_41320433/article/details/104453874 本人部署环境:wsl2+vllm+手搓ui cuda 12.2 vllm 2.7 连续问答测试: 。 。 反向输出一个链表。。 使用python写个程序实现他...
CodeFuse-DeepSeek-33b模型在代码能力方面表现卓越,在HumanEval和MBPP测试集上的pass@1指标值分别为78.65%和71%,平均达到74.83%。在多语言代码能力评测集HumanEval-X上,该模型的平均pass@1指标值为67.07%,在多种语言上的表现均超过了先前的模型。此外,CodeFuse模型还在NLP通用能力方面展现了强大的性能,在包括语言...