为了测试广泛的指标范围,作者应用了ProteinMPNN(一个使用蛋白质主链坐标的反向折叠模型)、带有序列传递的掩码反向折叠(MIF-ST,使用蛋白质原子坐标并结合预训练掩码语言模型的反向折叠模型)和OmegaFold(结构预测,不需要多序列比对)。作者选择了OmegaFold,因为其在单序列评估设置中的性能优越,并且与其他方法相比大约有30倍...
为了测试广泛的指标范围,作者应用了ProteinMPNN(一个使用蛋白质主链坐标的反向折叠模型)、带有序列传递的掩码反向折叠(MIF-ST,使用蛋白质原子坐标并结合预训练掩码语言模型的反向折叠模型)和OmegaFold(结构预测,不需要多序列比对)。作者选择了OmegaFold,因为其在单序列评估设置中的性能优越,并且与其他方法相比大约有30倍...
在天然蛋白质主链上,它实现了2.68的困惑度(perplexity)和57.51的序列恢复率(sequence recovery rate),分别比ProteinMPNN高39.2%和25.1%。此外,作者通过重新设计PETase和L-MDH验证了模型的有效性。对于PETase,所有设计的15个可变长度的PETase都表现出解聚活性,其中11个超过了野生型的活性水平。对于L-MDH,一种缺乏实验...
et al. Robust deep learning–based protein sequence design using ProteinMPNN. Science 378, 49–56 (2022). Article ADS CAS PubMed PubMed Central Google Scholar Gao, Z. et al. PiFold: Toward effective and efficient protein inverse folding. In International Conference on Learning Representations ...
ESM-AA 在靶点-配体结合等任务的性能显著提升,超越目前 SOTA 蛋白语言模型,如 ESM-2,也超越了目前的 SOTA 分子表示学习模型 Uni-Mol 等。相关研究已经以「ESM All-Atom: Multi-scale Protein Language Model for Unified Molecular Modeling」为题,发表于机器学习顶级会议 ICML 上。