1. 推理数据集与思维链 Reasoning数据集是一类专门用于训练和评估模型推理能力的数据集。它们通常涉及复杂的逻辑推理、常识推理、数学推理、因果推理等任务,能够帮助模型处理多步骤推理问题和复杂推理情境。随着大语言模型(LLMs)和推理方法(如CoT)的发展,推理任务在自然语言处理(NLP)中的重要性日益增加。 Chain-of-Thought
一、GarbageOverflow:城市街道垃圾堆数据集 该垃圾堆数据集是通过爬虫从网上进行爬取得到的,一共包含1188张图片,有2个类别,分别为['overflow', 'No Overflow'],两个标签的数量分别为1734个标签和414个标签。部分数据集及类别信息如下: 二、垃圾桶满溢检测数据集 及时清理满溢的垃圾桶有利于营造良好的卫生环境。利...
https://github.com/SerialLain3170/AwesomeAnimeResearch Manga109 Manga109 一个带标注的漫画数据集。含四种bounding box:漫画框、人物框、文字框和脸框 论文/数据集地址:https://arxiv.org/pdf/2005.04425.pdf Creative Flow+ Creative Flow+ 论文/数据集地址:https://openaccess.thecvf.com/content_CVPR_2019/...
下载链接:http://suo.nz/33n6Xy该数据集收集了来自不同人群的皮肤镜图像,通过不同的方式获取和存储。最终数据集包含 10015 张皮肤镜图像,可用作学术机器学习目的的训练集。案例包括色素病变领域所有重要诊断类别的代表性集合:光化性角化病和上皮内癌/鲍温氏病 (akiec)、基底细胞癌 (bcc),超过50%的病变是通过组...
数据下载链接: https://hci.iwr.uni-heidelberg.de/node/3616 数据集介绍: 主要针对纹理背景上的杂项缺陷。 较弱监督的训练数据。 包含是个数据集,前六个为训练数据集,后四个为测试数据集。 每个数据集均包含以灰度8位PNG格式保存的1000个“无缺陷”图像和150个“有缺陷”图像。每个数据集由不同的纹理模型和...
1. Iris数据集 这个数据集可有名啦。它就像是一朵盛开在数据花园里的小花。Iris数据集包含了4个属性列和1个品种类别列。属性列分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。这个数据集里有3种不同品种的鸢尾花的数据,总共150条记录。这个数据集经常被用来做分类任务的练习,就像新手学骑自行车,先从简单的开始...
此外,这些数据集还可以用于训练负荷预测模型,以预测未来的电力需求。其他相关数据集:除了输电线路图像数据集外,还有许多其他与电气领域相关的数据集。例如,变电站烟火检测图像数据集,该数据集包含变电站内的烟火检测图像,用于烟火检测任务的训练和测试。还有导线破损检测图像数据集,该数据集包含导线的各种破损情况,用于...
COVID-19胸部x光数据集:https://www.kaggle.com/bachrr/covid-chest-xray 同时,如果你想在另一个数据集上工作,那么你也可以在Kaggle上获得CT医学图像(https://www.kaggle.com/kmader/siim-medical-images) 。尾注 总而言之,计算机视觉是人工智能的一个引人入胜的领域。在本文中,我讨论了一些我发现很有...
英文数据集 PubMedQA: A Dataset for Biomedical Research Question Answering 中文医疗领域语料 医学教材 培训考试 哈工大《大词林》开放75万核心实体词及相关概念、关系列表(包含中药/医院/生物 类别) 医学embedding 开源英文医学embedding 链接:https://github.com/lrs1353281004/Chinese_medical_NLP 2 医疗行业专业词汇...