中国硅基流动公司上线全球首个开源大规模混合注意力推理模型

2025-06-18  中国 来源:https://www.aibase.com/zh/news/19015 领域:信息

关键词:

据AIbase网6月17日消息,中国硅基流动公司正式上线全球首个开源大规模混合注意力推理模型MiniMax-M1-80k。该模型旨在为软件工程、长上下文理解和工具使用等复杂任务提供强有力的支持。据悉,MiniMax-M1-80k具备最大支持128K的上下文长度,为处理长文本提供极大便利。同时该模型采用了混合专家系统(MoE)架构和 Lightning Attention 机制,具备高效的强化学习扩展框架,不仅适用于传统的数学推理任务,还能够在真实的沙盒软件开发环境中发挥作用。在性能方面,MiniMax-M1-80k 在数学、编程、工具使用及长上下文理解等领域的评测结果都与o3和Claude4Opus等顶尖模型不相上下。