2023-10-10 美国 来源:其他 作者:刘纪铖 领域:信息
关键词:
据机器之心公众号10月9日消息,美国加州大学圣克鲁兹分校研究团队提出多模态模型MiniGPT-5,具有文字与视觉交叉生成能力。该研究团队引入一个结构化框架,将预训练好的多模态大型语言模型和文本到图像生成模型整合在一起,同时,还引入了特殊的视觉符号“生成式 voken”(Generative vokens),可直接在原始图像上进行训练。实验表明,MiniGPT-5性能超越其他多模态生成式模型。
消息来源:https://mp.weixin.qq.com/s/HXCcBPio__vkGmI8GibLeA