OpenMathInstruct-1是一个包含180万个问题-解决方案对的数学指令数据集,通过生成流行的数学推理基准问题的代码解释器解决方案来构建。该数据集填补了闭源和开源语言模型之间的差距,并取得了竞争性的性能。OpenMathInstruct-1比现有数据集大4倍,并以宽松的许可证发布。通过精调模型的性能证明了数据集的质量。本文还讨论...
1、性能提升:在多个基准测试(如 DROP、WinoGrande、GSM8K、MMLU-STEM 等)上,使用 CODEI/O 和 CODEI/O++ 训练的模型表现优于单阶段基线和其他数据集(如 WebInstruct、OpenMathInstruct2 等),在几乎所有基准测试中都显示出一致的改进,而不仅仅是代码相关任务,还包括逻辑、符号、数学、科学和常识推理等任务。2、...