2025-11-21 美国 来源:https://news.aibase.com/zh/news/22950 领域:信息
关键词:
据AIbase网11月20日消息,美国Meta发布第三代"分割一切"模型(Segment Anything Models)SAM 3。SAM3最核心的创新在于引入"可提示概念分割"能力,首次支持用户通过自然语言描述和图像示例来识别、分割和追踪视频中的任何物体,突破了传统模型依赖固定标签集的限制。推理速度上,在一块英伟达H200 GPU上,SAM 3模型处理含100多个目标物体的单张图像仅耗时30毫秒,在处理约五个并发目标物体的视频场景中,可维持接近实时的性能。SA-Co基准测试结果显示,SAM 3在图像和视频的概念分割性能方面,性能大幅提升,且整体性能始终优于Gemini 2.5 Pro 等基础模型以及GLEE、OWLv2 和 LLMDet 等强大的专业基线模型。Meta同时发布了用于3D重建的开源模型SAM 3D,并在多个3D基准测试中的准确性和鲁棒性实现了阶跃式提升,表现超越了以往模型。