1 同构图数据集 Cora 来源:PyG 路径:/Dataset/PyG/Cora 结点数:2708 边数:1,3264(增加反向边和自环后) 结点特征:1433维 结点标签:7类,2708 (100%) 3: 818 (30%), 4: 426 (15%), 2: 418 (15%), 0: 351 (12%), 5: 298 (11%), 1: 217 (8%), 6: 180 (6%) 训练集:7类,140 (...
Zihao Qi:Cora数据集介绍 graphsandnetworks.com/t 成森:从上到下|图网络开放数据集 3: 社交网络(Reddit/BlogCatalog) 适用范围: 社区发现,链路预测 3.0 来源 Reddit数据集是由来自Reddit论坛的帖子组成,如果两个帖子被同一人评论,那么在构图的时候,就认为这两个帖子是相关联的,标签是每个帖子对应的社区分类。 Re...
经典的 MNIST 数据集 [1] 包含了大量的手写数字。十几年来,来自机器学习、机器视觉、人工智能、深度学习领域的研究员们把这个数据集作为衡量算法的基准之一。你会在很多的会议,期刊的论文中发现这个数据集的身影。实际上,MNIST 数据集已经成为算法作者的必测的数据集之一。有人曾调侃道:"如果一个算法在 MNIST 不...
LabelMe :麻省理工学院用于多边形注释的行业经典开源工具,但精度非常低。 PolygonRNN++: 仅作为演示版提供,但仍然非常有前景;在Cityscapes数据集上训练的工具确实为自动驾驶汽车生成自动标签,并加强学习。
费马LightGraph图数据库 费马科技有限公司自主研发的LightGraph图数据库和PandaGraph图分析引擎两款产品,具备完善的工具链和卓越的性能,具备万亿级别的图数据分析能力,实现千万顶点每秒的查询速度,提供超过25个内置图分析算法,同时可与Hadoop大数据平台无缝结合,是超大规模数据关联分析的绝佳平台。
如果将样本点看做图中的点,则这是一个连通的图,不存在孤立点(?)。 文件格式 下载的压缩包中有三个文件,分别是cora.cites,cora.content,README。 数据集两个文件: 1个是cora.content 节点的特征 1个是cora.cires 边的信息 README是对数据集的介绍;cora.content是所有论文的独自的信息;cora.cites是论文之间...
数据集地址如下: https://github.com/KaiDMML/FakeNewsNet https://zenodo.org/record/3841644#.YSGPRC1h1GM SNAP数据集 斯坦福网络分析平台(SNAP)是一个通用的网络分析和图挖掘库。它是用c++编写的,很容易扩展到具有数亿个节点和数十亿条边的大规模网络。它...
Labeled Dataset(标记数据集):是原始视频数据的子集它由成对的RGB和深度帧组成,这些帧已同步并为每个图像标注了密集标签。此数据还包含了一组预处理的深度图,其缺失值已使用Levin等人的着色方案进行了填充。与raw数据集不同的是,带有标签的数据集作为Matlab .mat文件提供,具有以下变量:...(网站链接里写了) ...
OpenStreetView-5M是一个大规模、开放访问的数据集,包含超过510万张地理参照的街景图像,覆盖225个国家和地区。 题目:OpenStreetView-5M: The Many Roads to Global Visual Geolocation 链接:https://github.com/gastruc/osv5m?utm_source=uwl.me https:/...
ImageNet 数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注,具体信息如下: Total number of non-empty synsets: 21841 Total number of images: 14,197,122 Number of images with bounding box annotations: 1,034,908 ...