英国科研团队用密码子训练大语言模型助力计算蛋白质工程研究

2024-03-06  英国 来源:其他 作者:戴吉 领域:生物

关键词:

据ScienceAI公众号3月4日消息,英国牛津大学科研团队开发出基于密码子训练的语言模型CaLM。该模型基于密码子序列上与训练的蛋白质语言模型,可产生能够捕获关键生化特征的信息丰富的蛋白质表征,在物种识别、蛋白质和转录本风度预测等任务中的表现相较基于氨基酸序列训练的语言模型具有显著优势。该研究提供了更简单的模型架构,为研究调控特性等深度蛋白质工程研究提供了有意义的方向。相关研究成果发表于Nature Machine Intelligence期刊。

消息来源:https://mp.weixin.qq.com/s/hswpgCMn_O2ayHvgRTBNeg