近日,清华大学药学院田博学课题组研究提出了一个基于蛋白质语言模型和对比学习的蛋白质-小分子结合位点预测模型(CLAPE-SMB),并整理了蛋白质-小分子结合位点数据集UniProtSMB,发现该模型在UniProtSMB的测试集上达到了0.699的MCC,优于其他模型。与基于结构的预测方法相比,CLAPE-SMB特别适用于缺乏精确实验结构的蛋白...
进一步,我们选取了两个在固有无序区域(IDR)上有小分子结合位点的IDP进行案例研究,结果显示CLAPE-SMB能够准确预测出IDR上的结合位点。 图3:固有无序蛋白的案例研究 绝大多数蛋白质尚未解析结构,其中包括大量膜蛋白,而膜蛋白通常与多种小分...
蛋白质与小分子的相互作用在很多生命活动中发挥关键作用,例如催化反应、信号传导、代谢调控等。小分子通过与蛋白质的特定位点结合,调控其活性,进而影响生物体内的多种功能。为了找到蛋白质上的这些结合位点,科学家们采用了许多实验方法,如表面等离子体共振(SPR)、质谱分析和X射线晶体学等高分辨率成像技术。这些实验方法能...
在这个算法中我们对结合位点的特征从氨基酸水平、原子水平和结 合位点自身水平三个不同的方面进行可计算性的描述,然后采用线性回归算法训练 出一套新的线性打分函数,将它与蛋白质-小分子对接软件MDock相结合来预测蛋 白质-小分子的结合位点。我们把该方法和现存的其他蛋白质-小分子结合位点预测方 法进行比较,发现该...
该研究提出了CLAPE-SMB,它将预训练的蛋白语言模型与对比学习相结合,实现了高精度的小分子结合位点预测,尤其适用于没有晶体结构的蛋白质。课题组在基于sc-PDB、JOINED和COACH420构建的非冗余SJC数据集上对CLAPE-SMB进行了训练和测试,获得了...
相比之下,基于序列的模型摆脱对结构的依赖,使用简单但精确度较低。如GraphBind和DeepProSite,在仅使用序列信息的情况下表现一般。因此,目前基于蛋白质序列的小分子结合位点的预测仍然是一个具有挑战性的问题。 研究过程 PROCESS 为了解决目前模型准确度低的问题,我们提出了CLAPE-SMB。CLAPE-SMB由三个模块组成。第一是...
I华中科技大学硕士学位论文摘要蛋白质-小分子结合位点预测是一个重要的科学问题,它对很多研究都有非常重要的指导意义,包括基于结构的药物设计、蛋白质的功能注释、分子..