泰坦尼克号数据集是Kaggle上最热门的数据集之一。这是一个很好的入门数据集,当中涉及到13个变量和超过1500个记录。该数据集中包含了乘坐泰坦尼克号的乘客信息。目标是根据乘客的特征来预测他们是否能幸存下来。根据数据集,你可以看到已婚女性比单身男性有更高的存活概率。该数据集中的变量有:年龄性别已婚或单身船票等...
nlmxir2里的数据集 用于PPK分析的数据集,包含了所有拟合必要的信息包括药物剂量、药物浓度、协变量、事件记录等信息。数据集的质量和构建安排很大程度上影响着拟合的质量,尤其是在大型实验涉及到多个队列的数据时. PK分析的dataset通常包含事件,自变量,因变量(DV,通常是药物浓度)等,是依照时间顺序记录的;而PD模型则根...
4、coco数据集,目标检测中yolo系列的训练集,包含'人','自行车','汽车','摩托车','飞机','公交车'等80个目标对象,总共163k多图片,便签是json的,可以自己转化为txt、xml等格式,用作目标检测、图像分割。 5、CityPersons数据集,用于街道车辆、行人的检测,500张图,有xml文件标注; 【地理地貌09】---直达 1、...
3.2 这个公共数据集适合解决什么问题? 这是一个多类分类问题,但也可以被定义为回归问题。它的分类数据是不均衡的(例如,正常葡萄酒的数量比优质或差的葡萄酒多得多),很适合针对不均衡数据集的分类练习。除此之外,数据集中所有特征并不都是相关的,因此也可以拿来练习特征工程和特征选择。 3.3 有用的链接 以下链接中...
本文整理汇总了90+深度学习各方向的开源数据集,包含了小目标检测、目标检测、工业缺陷检测、人脸识别、姿态估计、图像分割、图像识别等方向。 小目标检测 1.AI-TOD航空图像数据集 数据集下载地址:http://m6z.cn/5MjlYk AI-TOD 在 28...
天池数据集是阿里集团对外开放的科研数据平台,由阿里巴巴集团业务团队和外部研究机构联合提供,覆盖了电商、娱乐、物流、医疗健康、交通、工业、自然科学、能源等十多个行业,涵盖了数据挖掘、机器学习、计算机视觉、自然语言处理、决策智能等经典的人工智能技术领域。天池数据集分为如下几类: ...
1. 分类数据集 数据集:MNIST 手写数字数据集,包含一组60,000个示例的训练集和一组10,000个示例的测试集。 官网地址:MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges 关键字(建议复制):Face-Place 数据集:CIFAR-10
注意有关数据集架构的更多信息,请参见XML 架构和数据。 因为类型化DataSet类从基DataSet类继承,所以此类型化类承接DataSet类的所有功能,并且可与将DataSet类的实例作为参数的方法一起使用。 相形之下,非类型化数据集没有相应的内置架构。与类型化数据集一样,非类型化数据集也包含表、列等,但它们只作为集合公开。
一、寻找数据集的意义 根据CMU的说法,寻找一个好用的数据集需要注意一下几点:数据集不混乱,否则要...
业务系统数据库提取网络爬虫自主生成程序语言随机生成公开数据集下载从业务系统数据库提取需要在公司数据库系统使用,对于学习者而言这部分数据取到较为困难,并且也没有公司会愿意开放数据;通过网络爬虫进行数据爬取需要一定的编程语言能力;自主生成和程序语言随机生成又会与实际业务产生较大偏差,因此,在学习数据分析的时候最...