2026-01-16 美国 来源:其他 领域:先进制造
关键词:
据Techxplore1月15日消息,美国斯坦福大学和加州大学伯克利分校的研究人员推出了RoboReward数据集,用于训练和评估机器人应用中的AI算法,特别是基于视觉语言奖励的模型(VLMs)。研究团队表示:“我们用这些数据训练了 VLM,使它们能够观看机器人执行任务的视频(如任务描述所示),并在训练过程中输出高质量的奖励信号。最重要的是,我们以开放科学的精神将所有内容开源,包括数据集、评估集、训练模型和排行榜。”
https://techxplore.com/news/2026-01-roboreward-dataset-automate-robotic.html