通过利用RoseTTAFold的联合建模蛋白质序列和结构的能力,ProteinGenerator能够直接在序列空间中取样,同时确保3D结构是连贯的并满足任何期望的约束。虽然RFdiffusion、Chroma和其他蛋白质骨架扩散模型已经成功地生成了具有对结构特征精确控制的复杂骨架,但ProteinGenerator不仅设计蛋白质骨架,还设
DiffPack 基于扩散模型提出了一种新颖的侧链构象预测方法。通过对蛋白质侧链构象加入噪声并学习去噪过程,模型能够更准确地学习到蛋白质侧链构象的整体概率分布。蛋白质侧链的构象通常较为复杂,如果直接使用空间坐标的扩散过程建模会引入过多的自由度从而增加问题的复杂性。同时由于蛋白质的侧链构象由至多四个扭转角(χ1,...
在实现上,作者仅用一个简单的transformer作为backbone就训练出了一个去噪扩散概率模型。最终证明它可以无条件地生成高度真实的蛋白质结构,其复杂性和结构模式类似于天然蛋白质的结构模式。如下图Ramachandran plot(拉氏图,专门用于检测蛋白质构象是否合理)所示,左右分别为测试集和生成的蛋白质主干的(φ,ψ)二面角。
近年来,深度生成模型技术,特别是扩散模型,已被用于生成新的蛋白质构象。然而,现有的基于分数的扩散模型方法不能适当地纳入重要的物理先验知识来引导生成过程,导致采样的蛋白质构象与平衡分布之间存在较大偏差。 为了克服这些限制,本文提出了一种力引导的SE(3) (Euclidean 3D transformation) 扩散模型CONFDIFF,用于蛋白质...
为了在捕获其异质性的同时预测单细胞染色质结构,团队引入了 ChromoGen,它是一种扩散模型,已被证明在文本到图像应用以及预测配体和蛋白质分子的 3D 坐标方面具有很强的能力。图 1:ChromoGen 在使用序列数据对染色质组织进行从头预测时遵循的程序图示。(图源:论文)微调的 EPCOT 模型将 DNA 序列和脱氧核糖核酸酶...
随着扩散模型杀入蛋白质设计领域,时隔几天,Grigoryan和Ingraham等人以Generate Biomedicines公司的名义发表了一个新的扩散蛋白生成模型Chroma。它的创新点为通过随机图神经网络的架构进行低复杂度的长距离推理,通过一个基于凸优化的结构模块从预测的残基间几何信息高效地预测蛋白质的三维结构,通过低温采样提升扩散效果,以及针...
本文中,来自斯坦福大学、微软研究院等机构的研究者,他们受体内蛋白质折叠过程的启发,从而引入了一个折叠扩散( folding diffusion,FoldingDiff )模型,该模型通过镜像蛋白质天然折叠过程来设计蛋白质主链结构。论文地址:https://arxiv.org/pdf/2209.15611.pdf 代码地址:https://github.com/microsoft/foldingdiff ...
在此基础上,研究人员开发了 InstaNovo+,这是一种通过迭代细化预测序列来提高性能的扩散模型。使用它,研究人员提高了治疗测序覆盖率,发现了新的肽段,并在不同的数据集中检测了未报告的生物体,从而扩大了蛋白质组学搜索的范围和检测率。该研究以「InstaNovo enables diffusion-powered de novo peptide sequencing ...
扩散模型是一种在图像生成领域以外越来越广泛应用的技术。它不仅可以用于设计新型蛋白质,例如EvoDiff,还可以用于创作音乐甚至合成语音。这种模型的应用范围正在不断扩大。不同于传统的蛋白质生成框架,EvoDiff不是基于蛋白质的结构,而是基于蛋白质的序列空间来设计蛋白质。这意味着它可以合成一种特殊的蛋白质,即无序...
水质扩散模型在环境保护和水资源管理中发挥着重要作用。例如,在水源地保护方面,水质模型可以预测污染物在水源地中的分布,为防止污染提供科学依据,保护水源地的水质安全。此外,水质模型还可以用于水生态环境保护,预测水体中污染物的来源、分布和扩散,帮助制定...