通过比较多种物种中相同蛋白质的序列,识别在进化过程中高度保守的氨基酸残基。这些通常是功能性重要的残基,包括结合位点。模体搜索(Motif search)识别在已知的蛋白质-蛋白质相互作用中出现的短序列模体,并在未知蛋白中搜索这些模体。分子对接 使用计算模拟来预测两个或多个蛋白质结构如何物理上相互作用和结合。这种方...
2022年5月30日,以色列特拉维夫大学Blavatnik计算机科学学院的Haim J. Wolfson等人在Nat Methods杂志发表文章,提出了一种可解释的深度学习模型,该模型直接从原始数据中学习具有功能的结构基序 (motifs),从而可以将蛋白质结合位点和抗体表位准确地映射到蛋白质结构上。 摘要 从蛋白质的结构中预测其功能位点 (如小分子、其...
近日,清华大学药学院田博学课题组研究提出了一个基于蛋白质语言模型和对比学习的蛋白质-小分子结合位点预测模型(CLAPE-SMB),并整理了蛋白质-小分子结合位点数据集UniProtSMB,发现该模型在UniProtSMB的测试集上达到了0.699的MCC,优于其他模型。与基于结构的预测方法相比,CLAPE-SMB特别适用于缺乏精确实验结构的蛋白...
图4可以发现蛋白质序列和结构对于不同的任务有各自的优势,序列的表征更有利于二者结合强度预测,而结构...
上海交通大学和中山大学的研究人员提出了 DeepProSite,用于利用蛋白质结构和序列信息来识别蛋白质结合位点。DeepProSite 首先从 ESMFold 生成蛋白质结构,并从预训练的语言模型生成序列表示。然后,它使用 Graph Transformer 并将结合位点预测制定为图节点分类。在预测蛋白质-蛋白质/肽结合位点时,DeepProSite 在大多数...
蛋白质结合位点预测 蛋白质结合位点预测 蛋白质结合位点预测是一种重要的生物信息学方法,用于预测蛋白质与其配体之间的结合位点。生物大分子的相互作用是细胞中重要的调控机制之一,而蛋白质与其配体之间的结合位点是这种相互作用的核心。蛋白质结合位点预测可以帮助科学家们理解蛋白质的功能和作用机制,促进药物发现和分子...
图1. 基于CNN的蛋白质-多肽结合位点预测模型框架 2.1 特征选择与预处理 在特征选择方面,作者采用了在预测蛋白质-多肽结合位点问题上区分度较好的几组特征,如Halfsphere exposure (HSE)、Secondary Structure (SS)、Accessible SurfaceArea (ASA)、PSSM等特征,然后,作者将这几组特征伸展成一组([1, 38]的数值矩阵,...
DeepProSite 的研究动机在于蛋白质功能位点(如蛋白质、肽或其他生物组分的结合位点)的识别对理解相关生物过程和药物设计至关重要。 然而,现有基于序列的方法由于只考虑序列相邻的上下文特征且缺乏结构信息,预测准确性有限。 DeepProSite 使用 ESMFold 生成蛋白质结构和预训练语言模型生成序列表示,通过图转换器(Graph Transf...
在预测蛋白质-蛋白质/肽结合位点时,DeepProSite 在大多数指标上都优于当前基于序列和结构的方法。此外,与基于结构的预测方法相比,DeepProSite 在预测未结合结构时保持了高性能。DeepProSite 还可以扩展到核酸和其他配体结合位点的预测,验证了其泛化能力。 该研究以「DeepProSite: structure-aware protein binding site ...
DeepProSite 的研究动机在于蛋白质功能位点(如蛋白质、肽或其他生物组分的结合位点)的识别对理解相关生物过程和药物设计至关重要。 然而,现有基于序列的方法由于只考虑序列相邻的上下文特征且缺乏结构信息,预测准确性有限。 DeepProSite 使用 ESMFold 生成蛋白质结构和预训练语言模型生成序列表示,通过图转换器(Graph Transf...