近年来,计算方法通过准确模拟蛋白质与其属性适应度之间的关系,即所谓的“适应度景观”,在高效蛋白质优化中变得至关重要。 二、贡献 本文介绍了一种新颖的方法——去噪蛋白质语言模型(DePLM),用于改进蛋白质适应度预测。DePLM的核心思想是将蛋白质语言模型(PLMs)捕获的进化信息(EI)视为包含属性相关和不相关信息的混...
研究发现,在某些情况下,GNN比 ResNet 的模型优化程度更高,可以将预测出的蛋白质三级结构优化成与实际蛋白质更为接近的 3D 模型,其效果跟基于分子动力学的传统方法接近,但速度却是传统方法的几百倍,只需一个 CPU 花上 10 分钟左右就可以完成一个蛋白质模型的优化。 这项最新的研究成果于 7 月 15 日以「Fast...
联合上海人工智能实验室青年研究员谈攀,综合利用元迁移学习 (meta-transfer learning, MTL)、排序学习 (learning to rank, LTR) 和参数高效微调 (parameter-efficient fine-tuning, PEFT),开发了一种能在数据极度匮乏的情况下,有效优化蛋白质语言模型的训练策略 FSFP,可用于蛋白质适配性的小样本学习,在使用极少...
据悉,黄晶团队正在通过技术创新构建更准确的力场模型,从而对蛋白质、小分子和蛋白质的相互作用更准确建模。现阶段,该团队已经开发出一系列针对生物大分子的模型和算法。据黄晶介绍,在计算模型方面,团队的技术创新点主要得益于深度学习模型,将深度学习中的多种工具借用到力场优化中。比如说,直接优化实验观测值对于力...
与扩大蛋白质语言模型(PLMs)的规模不同,我们致力于通过蛋白质特定的优化来提高性能。虽然语言模型大小与其学习表示丰富程度之间的比例已得到验证,但我们优先考虑可访问性,并追求数据高效、成本降低和知识引导的优化路径。通过超过二十个实验,涵盖掩码、架构和预训练数据等多个方面,我们从蛋白质特定实验中获得洞察力,构建...
我们发现,所提出的基于排序的去噪过程能显著提高蛋白质的优化性能,还能保持强大的泛化能力。目前,DePLM 已开源,由于模型的配置环境较为复杂,我们在 HyperAI超神经官网的教程板块上线了「DePLM:用去噪的语言模型优化蛋白质(小样本)」。为了帮助大家更好地理解和复现我们的工作,我将从 DePLM 模型如何运行,其...
研究人员开发了一个计算程序,以帮助设计治疗用蛋白质,预测相互作用。 研究人员已经开发出一种过程,他们说这种过程可以减少计算蛋白设计所涉及的工作。该技术使用三维(3D)结构模型来预测分子嵌段的新颖组合如何协同工作以实现所需的效果。 来自美国达特茅斯学院的研究小组建议,专注于相对较少数量的蛋白质亚结构,而不是无限...
借助扩散去噪过程助力大模型对蛋白质的优化 内容简介 本课题组提出将大模型与扩散去噪模型相结合的方法,通过少量湿实验数据进行精细微调,提升大模型在蛋白质适应性景观预测任务精准度的同时,保持了模型自身良好的泛化能力。 观众获益 1. 了解蛋白质适应性景观 (fitness landscape) 预测的方法、数据集和指标 ...
蛋白质根据呼列同 源性可以分成不同的家族,序列同源性大于30%的蛋白质可能由同一祖先进化而来,称为 同源蛋白质&同源蛋白质通常具有相似的结构和功能,所以利用结构已知的同源蛋白质可 以建立待预测序列的结构模型,然后用理论计算进行优化3"51。但是对于序列同源性小于收稿日期:200142-25.作者w介:唐焕文(1965年1月生...
这项研究通过开发UTR-LM模型,提高了对mRNA调控区功能解码的准确性,为蛋白质表达的预测和优化提供了新的视角。该模型在核糖体装载、翻译效率和表达水平预测等多个生物学任务上展现出优越性能,并通过湿实验验证了其预测的新5′ UTR设计的有效性。研究不仅拓展了对mRNA 5′ UTR功能的理解,也为未来的基因调控和疗法创...