一般意义上,图对比学习是一种针对图数据的自监督学习算法。对给定的大量无标注图数据,图对比学习算法旨在训练出一个图编码器,目前一般指图神经网络(Graph Neural Network,GNN)。由这个 GNN 编码得到的图表示向量,可以很好地保留图数据的特性,并进一步在无监督、半监督、迁移学习以及鲁棒性测试等实验设置下进行测试,并...
强强联合!图神经网络+对比学习,刷爆SOTA,霸榜顶会 强强联合!图神经网络+对比学习,刷爆SOTA,霸榜顶会,附11种创新思路+代码#人工智能 #深度学习 #图神经网络 #对比学习 - 人工智能论文搬砖学姐于20240613发布在抖音,已经收获了21.4万个喜欢,来抖音,记录美好生活!
如图1所示,DGCL预训练阶段(图1A)对每个分子图分别使用GIN和GAT生成两个特征表示,对特征进行对比分析,将同一分子图通过不同图网络得到的表示视为正对,将同一批中其他样本的表示视为负对,从预训练的GIN和GAT网络中获得的分子特征与混合MFP相连接,并通过全连接层进行转换以匹配图网络特征的维数,然后预测层输出结果进行...
📚 今日研究亮点:利用图神经网络(GNN)进行分子表征的对比学习。这一工作探索了分子表征的自监督学习,通过GNN结合三种分子图增强策略——原子掩蔽、键删除和子图删除,来实现分子对比学习。🔍 对比学习中的正对和负对策略,MolCLR模型学习了GNN主干的信息表示。实验结果显示,经过MolCLR预训练的GNN模型在多种分子基准上...
对比学习:对比不同数据扩充方法生成的数据。关于样本对(内部数据)之间的差异和相同性的信息被用作自监督信号。 生成式学习:它关注数据中嵌入的(数据内)信息,通常基于重建等prtext任务,这些任务利用数据本身的属性和结构作为自我监督信号。 预测学习:它通常通过一些简单的统计分析或专家知识,从图数据中自生成标签,并基...
DGCL模型的成功在于其独特的双图神经网络对比学习策略。通过采用不同的GNN编码器,该模型能够充分利用分子固有的结构信息,捕捉分子的多维特征。同时,通过构建丰富的正负样本对,DGCL模型增强了模型对分子表征的区分能力,避免了过拟合的风险。此外,混合分子指纹的引入也为模型提供了更准确、更全面的分子特征表示。
综上所述,DGCL模型是一项具有创新性和实用性的研究成果。通过双图神经网络对比学习和混合分子指纹的结合,该模型实现了对分子性质的精准预测,为化学研究注入了新的活力。随着技术的不断发展,相信DGCL模型将在更多领域展现出其独特的优势和价值。
核心的思想是,对输入的二分图,做结点和边的dropout进行数据增强,增强后的图可以看做原始图的子视图;在子视图上使用任意的图卷积神经网络,如LightGCN来提取结点的表征,对于同一个结点,多个视图就能形成多种表征;然后借鉴对比学习的思路,构造自监督学习任务,即:最大化同一个结点不同视图表征之间的相似性,最小化不同...
作者提出了一种基于双图神经网络(Dual-GNN)的对比学习(CL)与混合分子指纹(MFP)相结合的分子性质预测方法DGCL。DGCL包含两个阶段。在预训练阶段,使用两个不同的GNN作为编码器来构建CL,而不是像以前那样使用生成增强图的方法。DGCL通过图同构网络(GIN)和图注意力网络(GAT)聚集和增强了同一分子的特征,从同一分子中提...
分子机器学习(ML)在分子性质预测和药物发现方面具有重要的应用前景,然而,获取标记分子数据既昂贵又耗时。由于标注数据有限,机器学习监督学习模型推广到巨大的化学空间极具挑战性。本文提出了一种利用大量未标记数据(约1000万个独特分子)的自监督学习框架MolCLR(通过图神经网络进行表征的分子对比学习)来解决这一难题。