CodeFuse-DeepSeek-33B模型是基于DeepSeek-Coder-33b底座进行微调的。通过MFTCoder框架对5个下游任务数据进行微调,模型实现了优异的代码生成和语言理解能力。 在HumanEval和MBPP测试集上,CodeFuse-DeepSeek-33B模型的pass@1指标值分别达到了78.65%和71%,平均达到74.83%。这一成绩不仅证明了模型在代码能力方面的卓越表现...
codefuse deepseek coder 33b 编程能力测试 大题 测试了几十道题,基本上都是一次性通过,真的好强。。。 源题库链接: https://blog.csdn.net/qq_41320433/article/details/104453874 本人部署环境:wsl2+vllm+手搓ui cuda 12.2 vllm 2.7 连续问答测试: 。 。 反向输出一个链表。。 使用python写个程序实现他...
CodeFuse-DeepSeek-33b模型在代码能力方面表现卓越,在HumanEval和MBPP测试集上的pass@1指标值分别为78.65%和71%,平均达到74.83%。在多语言代码能力评测集HumanEval-X上,该模型的平均pass@1指标值为67.07%,在多种语言上的表现均超过了先前的模型。此外,CodeFuse模型还在NLP通用能力方面展现了强大的性能,在...
CodeFuse-DeepSeek-33b模型在代码能力方面表现卓越,在HumanEval和MBPP测试集上的pass@1指标值分别为78.65%和71%,平均达到74.83%。在多语言代码能力评测集HumanEval-X上,该模型的平均pass@1指标值为67.07%,在多种语言上的表现均超过了先前的模型。此外,CodeFuse模型还在NLP通用能力方面展现了强大的性能,在包括语言能...
CodeFuse-DeepSeek-33b模型在代码能力方面表现卓越,在HumanEval和MBPP测试集上的pass@1指标值分别为78.65%和71%,平均达到74.83%。在多语言代码能力评测集HumanEval-X上,该模型的平均pass@1指标值为67.07%,在多种语言上的表现均超过了先前的模型。此外,CodeFuse模型还在NLP通用能力方面展现了强大的性能,在包括语言...
#CodeFuse-DeepSeek python3 convert.py -i path/to/model -t q8_0 -o quantized.bin -a CodeFuseDeepSeek #For other models, such as ChatLLM-6B, ChatLLM2-6B, InternLM, LlaMA, LlaMA-2, Baichuan-2, etc python3 convert.py -i path/to/model -t q8_0 -o quantized.bin ...