苹果公布多模态大模型MM1,具备300亿参数

2024-03-20  美国 来源:其他 作者:刘纪铖 领域:信息

关键词:

据品玩网3月18日消息,美国苹果公司公布多模态大模型MM1,具备300亿参数。MM1多模态大模型由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中可实现最好表现(SOTA),在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。此外,MM1在上下文预测、多图像和思维链推理等方面具有不错的表现。相关研究发表在预印本网址Arxiv上。

消息来源:https://www.pingwest.com/w/293254