中国阿里巴巴公司发布国内首个“混合推理模型”Qwen3,支持两种思考模式

2025-04-29  中国 来源:https://www.aibase.com/zh/news/17622 领域:信息

关键词:

据AIbase网4月28日消息,中国阿里巴巴公司通义千问团队推出国内首个“混合推理模型”Qwen3系列模型并开源。Qwen3拥有三大核心亮点:一是支持“快思考”和“慢思考”两种思考模式,这种集成极大节省了算力消耗;二是支持119种语言和方言,为国际应用开辟了新的可能性;三是在预训练方面,Qwen3的数据集相比Qwen2.5有了显著扩展,使用了约36万亿个token进行预训练。性能方面,Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等模型相比,仍展现出极具竞争力的结果。其中,小型MoE模型Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%,但表现更胜一筹。