本文提出了一种新的训练算法 Cluster-GCN,核心思想在于利用聚类算法将大图划分为多个簇,划分遵循簇间连接少而簇内连接多的原则,这种简单的方法有效的减少了内存和计算资源的消耗,同时也能取得非常好的预测精度。 5.Reference 《Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Net...
cluster gcn的思想非常简单暴力而直接,既然GCN没法一次性处理一个大图,我们就将大图切割为一大堆的小的子图,然后GCN分别在小的子图上训练,这样不仅可以batch training,还可以有效的降低显存的压力,一个子图的大小有限,所谓深层GCN也可以跑起来。 具体的思路如上图,我们以单个节点为例,即上图的红色节点,可以看到随着层...
本周阅读的论文题目是《Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks》,这是一篇在2019年发表在KDD上的一篇经典的文章,文章提出的模型名字叫Cluster-GCN。 图卷积网络(GCN)已经成功地应用于许多基于图的应用; 然而,培训一个大规模的GCN仍然具有挑战性。 现有的基于S...
基于Cluster-GCN的医疗保险欺诈检测 研究 摘要:医疗保险欺诈是现阶段医疗保险机构面临的重大挑战,由于保险基金 规模的扩张,欺诈导致的基金损失也在增加。随着大数据技术的发展,医疗保险欺 诈检测技术在不断提高。本文针对个人的多条就诊记录与多个就诊医院,使用基于 图聚类(社群发现)改进GCN的Cluster-GCN方法来搭建被保险...
Vanilla Cluster-GCN Time and Space complexity Stochastic Multiple Partitions Issues of training deeper GCN Experiment Training Deeper GCN Conclusion Abstract 大规模GCN的训练:目前基于SGD的gcn算法,1)面临随着gcn层数增长,计算复杂度呈指数增长;2)需要保存整个Graph和每个node的embedding,存储量巨大。
训练两层GCN的VRGCN比Cluster-GCN快,但是却慢于增加一层网络但实现相似准确率的Cluster-GCN 在内存使用方面,VRGCN比Cluster-GCN使用更多的内存(对于三层的情况5倍多)。当训练4层GCN的时候VRGCN将被耗尽,然而Cluster-GCN当增加层数的时候并不需要增加太多的内存,并且Cluster-GCN对于这个数据集训练 4 层的GCN将实现...
Cluster-GCN Chiang W., Liu X., Si S., Li Y., Bengio S. and Hsieh C. Cluster-GCN: An efficient algorithm for training deep and large graph convolutional networks. KDD, 2019. 概 以往的 GraphSage, FastGCN 等方法, 虽然能够实现 mini-batch 的训练, 但是他们所采样的方式效率是很低: 所采样...
Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks This repository contains a TensorFlow implementation of "Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks" by Wei-Lin Chiang, Xuanqing Liu, Si Si, Yang Li, Samy ...
This repository provides a PyTorch implementation of ClusterGCN as described in the paper: Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks Wei-Lin Chiang, Xuanqing Liu, Si Si, Yang Li, Samy Bengio, Cho-Jui Hsieh. KDD, 2019.[Paper] ...
本发明公开了一种基于改进的ClusterGCN的文本分类方法,包括如下步骤:1)预处理;2)数据集划分;3)初始化;4)训练模型;5)输出.这种方法实现了数据的增强,同时缓解了网络层数加深带来的过平滑问题,减少了邻域扩展的范围避免了大量的邻域搜索,有效减少了内存消耗,提高了计算效率,通过节点聚类的方法,来减少偏远节点对当前...