近日,国内权威医疗大模型测评平台CMB(Comprehensive Medical Benchmark in Chinese)在官网更新了中文医疗模型评估(CMB-Exam)排名,微医医疗大模型以91.71的平均值高居榜首。CMB作为专为中文医疗环境打造的全方位、多层次医疗基准,涵盖了28万多道题目及复杂病例会诊,模拟真实医疗场景,全面评估大模型的医学知识和临...
总的来说,CMB-Exam的数据集来源中,压倒性多的是医师的QA题目,剩下的是学科考试的题目,最少的是考验题目和护理题目,这样的分布和现实世界中不同题目类型的热度和需求度有很大的关系。 数据示例 CMB-Exam 数据格式如下,形式和考试的笔试题类似: { "exam_type": "医师考试", "exam_class": "执业医师", "...
本次荣登CMB-Exam榜首的“WiseDiag- v1”便是由杭州智诊科技有限公司的研发团队自研的智诊AI医疗大模型,根据网络检索信息来看,智诊科技成立于2023年,但其实早在今年的6月份,该公司就已经顺利通过了国家境内深度合成服务算法备案(网信算备330113458888801240019号),成为新一家成功进入“生成式人工智能医疗俱乐部”的成员...
CMB通过医学知识的多层次综合评估(CMB-Exam)和基于真实病例的复杂临床诊断问题(CMB-Clin)两大板块,全面检验大模型在医学知识与诊断能力上的表现。其中,CMB-Exam的构建理念源于真实医疗领域的考核体系,旨在评测模型对于医疗知识的掌握程度。
2024年9月3日,作为国内最权威的医疗大模型评测平台,CMB官方更新了最新的中文医疗模型评估(CMB-Exam)排名,其中“WiseDiag- v1”医疗大模型以平均分87.48分勇夺全球排名第一!而这一成绩背后的杭州智诊科技有限公司(以下简称“智诊科技”)也首次进入行业视野,宛如一匹黑马,引发生成式AI医疗大模型一众企业关注和热议。
CMB-Exam包括以下主要的医学专业类别: 医师(Physician) - 住院医师(Resident Physician) - 执业助理医师(Licensed Assistant Physician) - 执业医师(Licensed Physician) - 中级职称(Associate Professional Physician) - 高级职称(Advanced Professional Physicians) 护理(Nurse) - 护士(Practicing Nurse) - 护师(Licensed...
智通财经APP获悉,近日,国内权威医疗大模型测评平台CMB(Comprehensive Medical Benchmark in Chinese)在官网更新了中文医疗模型评估(CMB-Exam)排名,微医医疗大模型以91.71的平均值高居榜首。 CMB作为专为中文医疗环境打造的全方位、多层次医疗基准,涵盖了28万多道题目及复杂病例会诊,模拟真实医疗场景,全面评估大模型的医学...
近日,CMB官方发布了最新的中文医疗模型评估(CMB-Exam)排名,列出了从四种生成类别中选择的最佳准确率:Zero-shot (with/without COT) and Few-shot (with/without COT) 生成和评估的详细信息。包括香港中文大学、阿里云通义千问、中科院深圳先研院、蚂蚁集团、美国人工智能研究公司等团队成功上榜。其中健培科技啄医生医...
近日,国内权威医疗大模型测评平台CMB(Comprehensive Medical Benchmark in Chinese)在官网更新了中文医疗模型评估(CMB-Exam)排名,微医医疗大模型以91.71的平均值高居榜首。 医疗AI赛道趋热,诸多玩家纷纷入场,伴随行业竞争的加剧,技术和数据等壁垒逐渐显现。
近日,国内权威医疗大模型测评平台CMB(Comprehensive MedicalBenchmarkin Chinese)在官网更新了中文医疗模型评估(CMB-Exam)排名,微医医疗大模型以91.71的平均值高居榜首。 CMB作为专为中文医疗环境打造的全方位、多层次医疗基准,涵盖了28万多道题目及复杂病例会诊,模拟真实医疗场景,全面评估大模型的医学知识和临床咨询能力...