通过对比数据观察到,LLaMA2在多个方面优于LLaMA1,尤其是与LLaMA1-65B模型相比,LLaMA2-70B在MMLU和BBH基准上的成绩分别提高5分和8分。此外,在除代码基准外的所有测试中,LLaMA2-7B和30B模型都优于同规模的MPT模型。在与Falcon模型的对比中,LLaMA2-7B和34B在所有基准测试中的表现均优于Falcon-7B和40B模型。LL...