OGB-Products数据集 舍 舍予670 CC0 分类机器学习 48 6 2021-12-08 详情 相关项目 评论(0) 创建项目 文件列表 dataset.zip dataset.zip (1412.62M) 下载 File Name Size Update Time __MACOSX/._dataset -1 2021-12-08 15:33:49 dataset/.DS_Store -1 2021-12-08 15:33:49 __MACOSX/dataset/....
导读:近日,在国际顶级图学习标准OGB(Open Graph Benchmark)挑战赛中,腾讯大数据Angel Graph团队联合北京大学-腾讯协同创新实验室,以较大优势在三个最大的OGB分类数据集:ogbn-papers100M、ogbn-products和ogbn-mag三项任务榜单第一! OGB是目前公认最权威的图学习通用性能评价基准数据集,由斯坦福大学Jure Leskovec...
1、OGB节点预测(5个数据集) 1. 1ogbn-products--亚马逊产品联合采购网络 无权无向图(ClusterGCN-master) 节点代表产品,边代表2个产品被一起购买。节点特征为产品说明书中的单词,并进行了降维操作。共有47种类型。 数据的分割处理:对产品进行排序,销售量前8%用于训练,接下来的2%用于验证,剩余的用于测试。 1....
OGB是目前公认的图学习基准数据集代表,由斯坦福大学Jure Leskovec教授团队建立,于2019年国际顶级学术会议NeurIPS上正式开源。其囊括了节点性质预测、边性质链接预测、图性质预测等图学习领域众多权威赛道,以质量高、规模大、场景复杂、难度高著称,素有图学习领域“ImageNet”之称,吸引了包括微软、Deepmind、Facebook、阿里...
odbn-proteins:蛋白质数据集,有着蛋白质之间的关联网络,而且包括了多种生物;odbn-wiki:维基百科数据形成的网络;ogbn-products:亚马逊客户同时购买的商品的网络。 目前该基准测试所包含的数据集。 从数据集的类型来看,涵盖了现有的几大需要图表示学习的领域:生物学/分子化学、自然语言处理,以及商品推荐系统网络等。...
ogbn-products:亚马逊产品共同购买网络。 节点代表在Amazon销售的产品,两个产品之间的边表示产品是一起购买的。节点特征是通过从产品描述中提取词袋特征来生成的,然后进行主成分分析将维度减小到100。 预测任务:在多类别分类设置中预测产品的类别,其中有47个顶级类别用于目标标签。 数据集划分:使用销售排名(受欢迎程度)...
ogbn-products:亚马逊客户同时购买的商品的网络。 目前该基准测试所包含的数据集。 从数据集的类型来看,涵盖了现有的几大需要图表示学习的领域:生物学/分子化学、自然语言处理,以及商品推荐系统网络等。此外,这些图数据的量也非常大。例如,ogbn-wiki 的数据量已达到百万级别(节点),而最小的 ogbn-proteins 也有 ...
ogbn-products是无向、未加权图的数据集,这些图表示了亚马逊产品的“共同购买网络”。节点代表在亚马逊出售的产品,两个产品之间的边表示产品是一起购买的。 OGB按照Cluster-GCN论文来处理节点特征和目标类别。具体来说,节点特征是通过从产品描述中提取词袋特征,然后进行主成分分析以将维度减小到100来生成的。
当执行到dataset = DglNodePropPredDataset(name='ogbn-products')代码的时候,会执行 DglNodePropPredDataset的__init__函数。 其中,重要的是35行代码master = pd.read_csv(os.path.join(os.path.dirname(__file__), 'master.csv'), index_col=0, keep_default_na=False) , 这个代码是读一个名称为mas...
ogbn-products:亚马逊客户同时购买的商品的网络。 目前该基准测试所包含的数据集。 从数据集的类型来看,涵盖了现有的几大需要图表示学习的领域:生物学/分子化学、自然语言处理,以及商品推荐系统网络等。此外,这些图数据的量也非常大。例如,ogbn-wiki 的数据量已达到百万级别(节点),而最小的 ogbn-proteins 也有 ...