importdgl dataset=dgl.data.RedditDataset()g=dataset[0]print(g.formats())# 输出:{'created':['coo'],'not created':['csr','csc']} 所以需要注意,并非所有数据集总是coo格式的。
最后我们能得出以下完整训练代码: importtorchimporttorch.nnasnnfromdgl.dataimportRedditDatasetfromdgl.nnimportGATConvfromdgl.transformsimportAddSelfLoopclassGAT(nn.Module):def__init__(self,in_feats,num_classes,num_hidden=256,num_heads=2):super().__init__()self.conv1=GATConv(in_feats,num_hidden...
from dgl.data import RedditDataset from dgl.nn.pytorch import GraphConv def ddp_setup(rank, world_size): """ DDP初始化设置。 参数: rank (int): 当前进程的唯一标识符。 world_size (int): 总进程数。 """ os.environ["MASTER_ADDR"] = "localhost" # 设置主节点地址 os.environ["MASTER_PORT...
但这里有个坑,通过debug可以发现,在yelp中虽然变量名叫coo_adj,但实际是csr格式的! 再看一下Reddit,确实又是coo格式的: import dgl dataset = dgl.data.RedditDataset() g = dataset[0] print(g.formats()) # 输出:{'created': ['coo'], 'not created': ['csr', 'csc']} 1. 2. 3. 4. 5. ...
3.2 Reddit数据集https://aistudio.baidu.com/aistudio/datasetdetail/177810将Reddit帖子归类为属于不同...
3.10 GINDataset(即graphLsomorphism network dataset,图同构网络数据集) 图内核数据集的紧凑子集。数据集包含流行的图形内核数据集的紧凑格式,包括4个生物信息学数据集(MUTAG、NCH、PROTEINS、PTC)和5个社交网络数据集(COLAB、IMDBBNARY、MDBMULT、REDDITBINARY,REDDITMULT5K)。 3.11 PPIDataset(即protein-protein intera...
GINDataset(name,self_loop,degree_as_nlabel = False )[源] 图同构网络(GIN)的数据集改编自https://github.com/weihua916/powerful-gnns/blob/master/dataset.zip。 该数据集包含流行的图形内核数据集的紧凑格式,其中包括:MUTAG、Collab、IMDBBINARY、IMDBMULTI、NCI 1、蛋白质、PTC、REDDITBINARY、REDDITMULTI5K...
Dataset#Nodes#EdgesDensity (%)#Node features#Edge features cora 2708 5429 0.074 1433 0 pubmed 19717 44338 0.011 500 0 reddit 232965 11606919 0.021 602 0 ogbn-arxiv 169343 1166243 0.004 128 0 ogbn-product 2449029 61859140 0.001 100 0 Graph classification Dataset#Graphs#Nodes#EdgesDensity (%)...
Reddit GCN 0.1095 OOM OOM PubMed GCN 0.0156 0.0553 0.0185 PPI GCN 0.09 0.16 0.21 Cora GAT 0.0442 n/a 0.058 PPI GAT 0.398 n/a 0.752 High memory utilization allows DGL to push the limit of single-GPU performance, as seen in below images. Scalability: DGL has fully leveraged multiple GPUs ...
RedditDataset import tqdm import traceback ### Neighbor sampler class NeighborSampler(object): def__init__(self, g, fanouts): self.g = g self.fanouts = fanouts def sample_blocks(self, seeds): seeds = th.LongTensor(np.asarray(seeds))#这个seed⼀开始是dataloader⾥的batchsampler ,按照...