中国阿里开源旗下首个深度研究Agent模型通义DeepResearch,性能比肩OpenAI竞品

2025-09-18  中国 来源:https://www.pingwest.com/w/307714 领域:信息

关键词:

据品玩网9月17日消息,中国阿里开源旗下首个深度研究Agent模型通义DeepResearch。现有方法下,代理模型在处理长周期任务时,多面临“知空间窒息”和“不可逆的噪声污染”的挑战,导致推理能力下降,最终难以完成长程、复杂的研究任务。对此,研究团队构建了一套以合成数据驱动、贯穿预训练与后训练的完整训练链路。该链路以Qwen3-30B-A3B 模型为基座进行优化,为确保训练的高效性与模型的鲁棒性,团队创新性地设计了覆盖真实环境与虚拟环境的RL算法验证与真实训练模块,并结合高效异步强化学习算法及自动化数据策展流程,显著提升了模型的迭代速度和泛化能力。性能上,该模型在HLE、BrowseComp-zh、GAIA等多个权威评测集上取得SOTA成,超越OpenAI Deep Research、DeepSeek-V3.1等Agent模型。