瑞源自主研发AI-PPI模型以超60%准确度预测蛋白互作信息 蛋白质对于调节细胞中的各种新陈代谢途径以及众多生物学过程具有十分重要的意义。一般来说,蛋白质并不是单独发挥作用的,而是通过彼此之间发生相互作用,即蛋白质-蛋白质相互作用(PPI)来完成相应的任务。 随着计算机技术的高速发展,深度学习(DL)方法已被应用于研究P...
ColabFold将MMseqs2的快速同源搜索与AlphaFold2或RoseTTAFold相结合,提供了蛋白质结构和复合物的加速预测。ColabFold的搜索速度提高了40-60倍,并且优化了模型的利用,在一台有图形处理单元的服务器上每天可以预测近1000个结构。 ColabFold数据库是MMseqs2可扩展的图谱数据库,用于生成多种多序列比对以预测蛋白质结构。它们...
在这项工作中,研究人员借鉴了自然语言处理技术,开发了一种轻量级的蛋白质语言模型HNSPPI,用于预测蛋白-蛋白相互作用。 HNSPPI通过整合氨基酸序列信息和PPI网络的拓扑特性,综合表征任一蛋白对之间的内在关系(图1)。研究表明,HNSPPI在人类、酿酒酵母、小鼠等六个基准数据集上表现卓越,预测性能明显优于其他五种现有算法(...
具有包含许多折叠的块状 3D 结构的蛋白质可以以数百万种组合形式粘在一起,因此在几乎无数候选物中找到合适的蛋白质复合物非常耗时。 为了简化这一过程,麻省理工学院的研究人员创建了一个机器学习模型(Equidock),可以直接预测两种蛋白质结合在一起时将形成的复合物。他们的技术比当前最先进的软件方法快 80 到 500 ...
Guowei Wei 说:「目前的深度学习模型在预测药物或蛋白质如何协同作用时无法解释它们的形状。」Transformer 架构引入了一种新技术,利用注意力机制进行跨域顺序数据分析。受此启发,Wei 团队开发了一个拓扑 Transformer 模型 TopoFormer,将 Persistent Topological Hyperdigraph Laplacian(PTHL)与 Transformer 框架集成在一...
摘㊀要:化合物-蛋白质相互作用(Compound ̄proteininteractionꎬCPI)预测是药物研发领域的一个重大课题.随着生物科学的飞速发展ꎬ各种科学实验产生了大量的生物数据ꎬ通过计算方法能够快速有效地提取和利用这些信息.已有方法未能将相互作用网络中的信息显式地进行提取并加以利用ꎬ且多...
针对单一的计算方法预测蛋白质互作遇到的准确性波动问题,本文提出一种基于宽进严出策略获取可靠蛋白质互作的框架模型。根据设置的使用原则,该框架模型可以整合多种计算方法,共同对抗原始互作数据集中存在的噪声数据干扰,以及单一计算方法应用的生物学背景知识偏差。基于该框架模型预测的蛋白质互作具有多重生物学意义,提高了...
南京瑞源生物在基于传统蛋白互作的基础上,通过自主研发优化,与时俱进,开发了一项深度学习预测蛋白相互作用的模型AI-PPI。 AI-PPI的数据基础是什么? AI-PPI模型以BioGRID数据库、STRING数据库为数据基础,进行深度学习。 BioGRID数据库目前已更新至4.4版本,所有的相互作用关系数据基于文献,同时还收集了蛋白翻译后修饰以及...
最终输出是这些不同预测的共识,这使得 TopoFormer 成为一个分析蛋白质-配体相互作用的综合模型,既利用了拓扑洞察力,又利用了深度学习。 新模型经过数万种蛋白质-药物相互作用的训练,其中两种分子之间的…
Guowei Wei 说:「目前的深度学习模型在预测药物或蛋白质如何协同作用时无法解释它们的形状。」 Transformer 架构引入了一种新技术,利用注意力机制进行跨域顺序数据分析。受此启发,Wei 团队开发了一个拓扑 Transformer 模型 TopoFormer,将 Persistent Topological Hyperdigraph Laplacian(PTHL)与 Transformer 框架集成在一起。