DeepProSite 使用 ESMFold 生成蛋白质结构和预训练语言模型生成序列表示,通过图转换器(Graph Transformer)将结合位点预测转化为图节点分类问题。在预测蛋白质-蛋白质/肽结合位点方面,DeepProSite 在多数指标上优于现有的序列和结构基方法。 此外,与竞争对手的结构基预测方法相比,DeepProSite 在预测未结合结构时保持了性能。
DeepProSite 的研究动机在于蛋白质功能位点(如蛋白质、肽或其他生物组分的结合位点)的识别对理解相关生物过程和药物设计至关重要。 然而,现有基于序列的方法由于只考虑序列相邻的上下文特征且缺乏结构信息,预测准确性有限。 DeepProSite 使用 ESMFold 生成蛋白质结构和预训练语言模型生成序列表示,通过图转换器(Graph Transf...
结合位点预测 作者预先训练了一个称为MaSIF-site的模型,以蛋白质表面指纹为输入,输出每个表面顶点参与PPI的可能性预测分数,在包含12002个有共结晶结构的蛋白质的数据集上进行了训练和测试。 互补binder seed搜寻 基于MaSIF,可以发生相互作用的两个patch指纹描述符应该互补。文章中判断指纹互补的方式为:对其中一个patch...
为了解决从头binder设计问题,作者设计了一个三阶段的计算流程:i)使用MaSIF预测目标蛋白的可能结合位点;ii)基于MaSIF在包含1.4亿个patch的数据库中搜索与结合位点指纹互补的结构基序(binder seed);iii)利用Rosetta MotifGraft在scaffold数据库中搜寻包含seed结构的蛋白质,并用RosettaDesign对设计的相互作用界面进行优化,前...
DeepProSite 的研究动机在于蛋白质功能位点(如蛋白质、肽或其他生物组分的结合位点)的识别对理解相关生物过程和药物设计至关重要。 然而,现有基于序列的方法由于只考虑序列相邻的上下文特征且缺乏结构信息,预测准确性有限。 DeepProSite 使用 ESMFold 生成蛋白质结构和预训练语言模型生成序列表示,通过图转换器(Graph Transf...
总模型图里关于TextCNN的补充:除了局部上下文特征,全局序列特征也在PPI结合位点预测中至关重要。文本卷积神经网络(TextCNN)可以捕捉蛋白质序列的全局特征。传统CNN通常用于二维图像数据的特征提取。近年来,一些研究者开始使用CNN来处理文本。这种做法的中心思想是文本可以被视为一维图像。因此,一维CNN可以用捕捉这种...
近日,清华大学药学院田博学课题组研究提出了一个基于蛋白质语言模型和对比学习的蛋白质-小分子结合位点预测模型(CLAPE-SMB),并整理了蛋白质-小分子结合位点数据集UniProtSMB,发现该模型在UniProtSMB的测试集上达到了0.699的MCC,优于其他模型。与基于结构的预测方法相比,CLAPE-SMB特别适用于缺乏精确实验结构的蛋白...
结合位点预测 作者预先训练了一个称为MaSIF-site的模型,以蛋白质表面指纹为输入,输出每个表面顶点参与PPI的可能性预测分数,在包含12002个有共结晶结构的蛋白质的数据集上进行了训练和测试。 互补binder seed搜寻 基于MaSIF,可以发生相互作用的两个patch指纹描述符应该互补。文章中判断指纹互补的方式为:对其中一个patch...
据估计,整个蛋白质组中超过三分之一的蛋白是金属结合蛋白,然而通常只有少数氨基酸残基参与金属结合,因此准确预测金属结合蛋白及其结合位点并非易事。对蛋白质组中金属结合蛋白以及具体金属结合位点的鉴定有助于加深人们对蛋白质功能的理解和认...
中医药生物化学与分子生物学通讯PPARY受体蛋白三维结构和配体结合位点的预测孙聪吴强1水韩业超2唐婷婷王丽丽(长春中医药大学长春130117;1.吉林大学中日联谊医院长春130033;2.吉林省兽药饲料监察所长春130063)摘要目的;以过氧化物酶体增殖物激活受体丫(PPAR7)蛋白的氨基酸序列为基础,预测其三维结构与配体结合位点。方法:运...