2、LLaMA2任务性能与 GPT-4 任务性能对比 Meta团队还对LLaMA2-70B进行了与闭源模型的比较。结果显示,LLAMA2-70B在MMLU和GSM8K基准上的得分接近于GPT-3.5,但在编码基准上存在明显差距。与PaLM 540B相比,LLaMA2-70B在几乎所有基准测试中表现更为优越。然而,与GPT-4和PaL2-L相比,LLaMA2-70B仍然存在较大的性能差距。
我们甚至可以通过和ollama配套的前端方案anything_llm,实现我们熟悉的非常友好的问答界面和知识库,甚至本地化AGENT。~基于这种方案,你也可以把自己的家用大模型服务器搭起来~ 如果有比较好的硬件配置,基于llama3的8B构建AGENT客服也是完全没问题的。 实测LLAMA3的对话比国内常见的大模型更加俏皮和拟人化一点。 下面是它...