在八项行业标准基准测试中的六项中,Gemini Pro 的表现优于 GPT-3.5,包括 MMLU(大规模多任务语言理解),这是衡量大型 AI 模型的关键领先标准之一,以及衡量小学数学推理的 GSM8K。 最重要的是,特别调整了 Bard 中的 Gemini Pro,使其在理解、总结、推理、编码和计划等方面的能力要强得多。因此看到了很好的结果:在...