ESM3模型由人工智能初创公司Evolutionary Scale 研发,研究人员使用了超过31.5亿条蛋白质序列、2.36亿个蛋白质结构,以及5.39亿个带有功能注释的蛋白质数据来训练ESM3模型,进行三种不同规模模型参数构建,分别为14亿、70亿和980亿。实验表明,随着模型参数规模的增加,ESM3在生成能力和表示学习上的性能有显著提升,展现出了LLM那样