全球技术地图

全球

欧盟

英国

中国

美国

印度

以色列

日本

其他

中国阿里巴巴公司发布国内首个“混合推理模型”Qwen3，支持两种思考模式

2025-04-29 中国来源：https://www.aibase.com/zh/news/17622 领域：信息

关键词：

据AIbase网4月28日消息，中国阿里巴巴公司通义千问团队推出国内首个“混合推理模型”Qwen3系列模型并开源。Qwen3拥有三大核心亮点：一是支持“快思考”和“慢思考”两种思考模式，这种集成极大节省了算力消耗；二是支持119种语言和方言，为国际应用开辟了新的可能性；三是在预训练方面，Qwen3的数据集相比Qwen2.5有了显著扩展，使用了约36万亿个token进行预训练。性能方面，Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色，与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等模型相比，仍展现出极具竞争力的结果。其中，小型MoE模型Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%，但表现更胜一筹。