2025-09-17 美国 来源:其他 领域:信息
关键词:
据英伟达官网9月15日消息,美国英伟达与多伦多大学、向量研究所及德克萨斯大学奥斯汀分校的研究团队联合发布了一项名为ViPE(视频姿势引擎)的突破性技术。该技术旨在解决如何从复杂的自然视频中高效且精准地提取3D信息这一关键挑战。研究团队创新性地从原始视频中快速获取相机的固有特性、运动信息以及高精度的深度图,并采用一种多重约束的混合方法来确保ViPE的高精度,为空间AI系统提供了可靠的数据基础。测试结果显示,ViPE在多个基准测试中的表现均优于现有技术,还能在单个GPU上以每秒3到5帧的速度稳定运行。此外,研究团队还发布了一个包含约9600万帧标注数据的大规模数据集。ViPE的发布不仅标志着3D几何感知技术的重要进步,也为未来的空间AI应用奠定了坚实的基础。