LLMBook 数据集下载地址完整收集 | 本文针对《LLMBook》链接中的56个数据集进行完整下载地址整理收集。具体整理部分关于第三章 大型语言模型资源 1、常用预训练24个数据集下载地址整理收集 2、指令微调24个数据集下载地址整理收集 3、人类对齐8个数据集下载地址整理收集 《大语言模型》由作者赵鑫,李军毅,周昆,唐天一,文继荣 等
直接使用:https://go.hyper.ai/YePhv5. MMMLU 多语言多任务语言理解数据集该数据集旨在评估和提升人工智能模型在不同语言、认知和文化背景下的性能。MMMLU 建立在大规模多任务语言理解 (MMLU) 基准的基础上,是人工智能模型所达到的常识性指标,包含 57 个不同学科领域的任务,涵盖了从初级知识到法律、物理、...
DeepSeek-Prover-V2-671B 是DeepSeek 团队于 2025 年4月30日发布的开源超大垂直领域语言模型,专为在 Lean 4 语言中进行数学定理的形式化证明(formal theorem proving)而打造。该模型是 DeepSeek-V3 架构的继承者,采用冷启动推理数据合成与强化学习相结合的训练策略,成功将非形式化数学推理与形式化证明能力融合为一...
在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。 除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用。(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。 本代模型增加了多语言支持,支持...
聚数力,大数据,大数据应用,要素管理,金融大数据,商业大数据,制造业大数据,交通运输大数据,医疗健康大数据,社会服务大数据,能源大数据,人工智能,机器学习,数据挖掘,模式识别,自然语言理解,领域场景,领域知识,数据描述,数据集,数据下载,元数据,数据变换,分析方法,分析过程,分析结果,评价指标,评价过程,评价结果,数据模型,模型...
MMedC 数据集统计概览 2.MMedBench 多语言医学能力测试基准数据集 该数据集旨在评估医学领域多语言模型的发展,涵盖了 6 种语言和 21 种医学子领域。MMedBench 的所有问题直接来源于各国的医学考试题库,确保了评测的准确性和可靠性,避免了由于不同国家医疗实践指南差异导致的诊断理解偏差。
MMedC 数据集统计概览 2.MMedBench 多语言医学能力测试基准数据集 该数据集旨在评估医学领域多语言模型的发展,涵盖了 6 种语言和 21 种医学子领域。MMedBench 的所有问题直接来源于各国的医学考试题库,确保了评测的准确性和可靠性,避免了由于不同国家医疗实践指南差异导致的诊断理解偏差。
数据集图像示例 4. HelpSteer2 人类偏好对齐数据集 HelpSteer2 包含约 1 万对回答,尽管数量上比现有的偏好数据集少一个数量级,但它在训练奖励模型方面非常高效。该数据集旨在训练能够指导大型语言模型 (LLMs) 生成符合人类偏好的高质量回答的奖励模型。
1.百度智能云千帆大模型平台再升级,SDK版本开源发布 百度智能云千帆大模型平台再次升级,在原有 API基础上,百度智能云正式上线 Pvthon SDK 版本并全面开源,企业和开发者可免费下载使用。千帆SDK全面覆盖从数据集管理,模型训练,模型评估,到服务部署等方面的功能,用户可基于千帆SDK通过代码接入并调用百度智能云千帆大模型...
该数据集包含了约 255 亿个 tokens 的医疗预料数据,涵盖了 6 种主要语言:英语、中文、日语、法语、俄语和西班牙语,并且对更多语言的支持仍在不断更新和扩展中。 直接使用:go.hyper.ai/jXv0r MMedC 数据集统计概览 2. MMedBench 多语言医学能力测试基准数据集 该数据集旨在评估医学领域多语言模型的发展,涵盖了...