2023-01-11 美国 来源:其他 作者:戴吉 领域:生物
关键词:
据ScienceAI公众号12月24日消息,美国Facebook 的人工智能实验室(FAIR)发现ESM2语言模型通过学习深层语法,可生成天然蛋白质以外的新蛋白质,并可编程生成复杂和模块化的蛋白质结构。ESM2 通过学习深层语法,成功设计了152种蛋白质,其中35个与已知的天然蛋白质没有明显的序列匹配,同时其模型参数为150亿,是迄今为止最大的蛋白质语言模型。该研究用语言模型设计的蛋白质反映了连接序列和结构的深层模式,包括自然结构中出现的基序和已知蛋白质结构环境中未观察到的基序。实验结果表明,语言模型虽然只接受序列训练,但通过学习深层语法可以设计蛋白质结构,包括自然界中未出现过的蛋白质。