2025-11-19 美国 来源:其他 领域:信息
关键词:
据谷歌官网11月18日消息,美国谷歌正式发布新一代旗舰大模型Gemini 3 Pro。该模型在文本理解、视觉分析和代码生成三个维度实现了显著突破。具体来看,多模态融合能力是Gemini 3.0 Pro的核心优势,其通过统一编码器架构将文本、视觉和代码信息映射到同一表征空间,实现三种模态的深度交互。Gemini 3 Pro拥有世界领先的多模态理解力,在纯文本任务中展现出与GPT-4o相当甚至更优的性能,长文本推理的优势突出,可一次性处理约75万字的中文内容。同时,Gemini 3 Pro的最大突破在于其视觉理解能力,能够执行结构化信息提取和视觉推理任务。性能上,与上一代Gemini 2.5 Pro相比,3.0 Pro在MMLU基准测试中的得分从86.5%提升至91.2%,视觉问答准确率提高17个百分点,同时API响应延迟降低至1.8秒以下。