2025-07-21 全球 来源:其他 领域:信息
关键词:
据MIT Technology Review网7月18日消息,美国谷歌DeepMind与韩国科学技术院(KAIST)联合发布新型语言模型架构MoR(Mixture-of-Recursions)。该创新架构在保持模型性能的同时,实现了推理速度翻倍、训练计算量减少并降低了约50%的KV缓存内存使用。MoR架构的核心创新在于将递归计算与动态路由机制相结合,在统一框架内解决多重效率问题,为未来的语言模型架构设计,提供了一个在性能和效率上都极具潜力的发展方向。