美国谷歌DeepMind推出新一代通用世界模型Genie 3,重新定义生成式AI

2025-08-07  美国 来源:其他 领域:信息

关键词:

据MIT科技评论网8月6日消息,美国谷歌DeepMind发布新一代通用世界模型Genie 3。该模型能够根据用户的文本或图像提示,实时生成可供用户及AI智能体进行互动的3D虚拟环境。相比前代产品,Genie 3实现了向实时可交互虚拟世界模拟的重大跨越,尤其在互动时长和记忆连贯性上取得了巨大进步。例如,Genie 2虽然也能根据图像生成可互动的世界,但交互时间仅有10~20秒,且并非实时进行,分辨率也仅有360p,而Genie 3则能以720p的分辨率和每秒24帧的速率流畅运行,用户还可持续进行长达数分钟的互动,实现了质的提升。更重要的是,Genie 3拥有了初步的“记忆”能力,解决了前代模型在长时间交互后容易出现内容“遗忘”或前后矛盾的问题。Genie 3作为第一个真正意义上实现了实时交互的通用世界模型,已经清晰地展示了一条技术路径的可能性。